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Prefacio a la séptima edición 


Otros dos análisis teórico-experimentales de la conducta constituyen 
el marco histórico en el que debe evaluarse este libro. Me refiero a 
Purposive Behavior in Animals and Men, de Tolman, que precede a La 
conducta de los organismos en seis años, y a Principles of Behavior, de 
Hull, que le sigue en cinco. Los tres libros difieren en muchos aspectos: 
intentan resolver problemas diferentes y buscan las soluciones en luga- 
res distintos. 

Mi deuda con Sherrington, Magnus y Pavlov es obvia por lo que 
respecta al uso continuado del término “reflejo”. Seguí haciendo uso 
del término incluso después de empezar a distinguir entre conducta 
emitida y provocada —entre “respondientes” y “operantes”—, pues que- 
ría conservar la noción de fuerza del reflejo. En mi tesis sostuve que 
“el condicionamiento”, la “emoción” y el “impulso”? en cuanto con- 
ciernen a la conducta, deben considerarse esencialmente como cambios 
en la fuerza del reflejo”. Pero en mi primer experimento abordé los 
cambios experimentales por la frecuencia de respuesta en vez de la 
latencia, la magnitud de respuesta o la postdescarga, como en la prác- 
tica tradicional. Así, pues, la probabilidad de respuesta se convirtió en 
mi variable dependiente básica. Su importancia fue clarificada por el 
uso de un registro acumulativo, en el que los cambios de frecuencia a 
lo largo de períodos de tiempo relativamente largos pueden verse con 
una ojeada. Un simple dispositivo mecánico que genera una gráfica 
continua de este tipo mientras responde el organismo, “hace visibles los 
procesos conductuales”. 

Con la excepción de una rueda giratoria, el único aparato que po- 
seía era la ahora familiar “caja” que contiene un mecanismo administra- 
dor de comida o de agua operado por una palanca que podía ser accio- 


1. En inglés, drive: tendencia, impulso. En la traducción he optado por 
“impulso” por ser actualmente el término más generalizado. Para el concepto 
de “impulso”, ver el capítulo 9. (N. del T.) 
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nada por una rata. Unos cuantos relés y temporizadores conectaban 
y desconectaban los zumbadores y luces y conectaban o desconectaban 
la palanca y el mecanismo administrador. En el orden cronológico en 
que fueron estudiadas experimentalmente, mis variables independientes 
consistían en privación y saciedad, reforzamiento y no-reforzamiento, 
programas de reforzamiento, reforzamiento diferencial con respecto «a 
las propiedades de los estímulos y de las respuestas, consecuencias 
aversivas y unas cuantas drogas que ejercían influjo sobre la conducta. 

Como he señalado recientemente (en Operant Behavior: Areas of 
Research and Application, obra dirigida por Werner Honig), la conducta 
operante constituye esencialmente el campo de la voluntad a propósito. 
Tolman hizo un reconocimiento aún más explícito de la significación 
tradicional de este problema. Sus experiencias estaban destinadas a 
hacer visible el propósito en términos espaciales, en el movimiento 
de un organismo hacia un objeto o en sentido contrario. Casi todas 
las figuras de su libro referentes al instrumental son mapas. (No es 
sorprendente que sus experimentos le condujeran ul concepto de tra- 
zado de mapas cognitivos y que destacara las distinciones entre apren- 
dizaje de lugares y de respuestas.) La conducta dócil de Tolman es 
indudablemente parecida a la conducta operante, pero la docilidad, 
al igual que el propósito, era una propiedad o característica de la con- 
ducta en vez de una relación con una variable independiente. 

Tolman clasificó sus variables independientes como “estímulos, es- 
tados fisiológicos iniciales, y la herencia general del adiestramiento pa- 
sado del organismo”. Pero esta frase aparece casi al final de su libro 
en un capítulo titulado “Sumario y conclusiones para psicólogos y filó- 
sofos” y constituye menos un sumario que una prefiguración de una 
formulación diferente que iba a publicar tres años más tarde y que con- 
tiene la expresión: 


B=f(SPHTA). 
Esta expresión se parece a 
R=f(S,A) 


publicada en mi artículo de 1981. Las discusiones que tuve con Tol- 
man durante el verano de 1981, cuando enseñaba en los cursillos de 
verano de la Universidad de Harvard creo que son dignas de mención. 
Había terminado yo mis experimentos sobre “impulso y fuerza del re- 
flejo”, y sostenía que la frecuencia de ingestión de comida o de presio- 
nar una palanca cuando dicha presión era reforzada con comida, debía 
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considerarse como función de una “tercera variable”, esto es, una 
variable además del estímulo y la respuesta, en este caso una historia 
de privación y de saciedad. Aunque seguí usando el concepto de impul- 
so durante muchos años (J. R. Kantor al final me persuadió de los peli- 
gros que entrañaba), lo consideraba simplemente como una forma con- 
veniente de referirme a las variables ambientales. Tolman, no obstante, lo 
convirtió en una variable interviniente, aparentemente en su preo- 
cupación declarada de reemplazar o de reinterpretar los procesos men- 
tales. La “B” de su ecuación representa la conducta, pero debía 
cuantificarse, por si acaso, como una “razón de conducta”. El laberinto 
se había simplificado hasta la forma de una “T”, pero eso era todo, 
y así sobrevivía un residuo de propósito espacial. La conducta en un 
punto de elección estaba tan próxima que Tolman llegó al concepto de 
probabilidad de respuesta. 

La variable dependiente de Hull era la Fuerza del Hábito. “Hábito” 
procedía de los estudios del siglo xtx sobre conducta animal, pero el 
concepto de “fuerza” derivaba de la tradición reflexológica, y Hull por 
lo tanto utilizó medidas como la latencia y la magnitud de respuesta. 
Cuando él y sus discípulos empezaron a usar una “Caja de Skinner” 
modificada (parece que Hull fue el autor de la expresión, que yo nun- 
ca he utilizado), comenzó a aparecer la noción de probabilidad de res- 
puesta, aunque en su libro aparece relativamente tarde y sólo de paso, y 
no ha sido desarrollada por obras posteriores de la tradición hulliana. 
Las variables independientes de Hull son ejemplificadas por los estímu- 
los, el número de reforzamientos y la privación. 

Aunque los tres libros ostensiblemente tratan de explicar la conducta 
observada en términos de las condiciones y acontecimientos observa- 
bles, tanto Tolman como Hull pronto se interesaron por los estados y 
procesos internos. Esta posición es inevitable desde el momento en que 
se hace un esfuerzo para caracterizar el intercambio entre el organismo 
y el medio ambiente en términos de inputs y outputs. El output puede 
relacionarse de una forma simple con el input raras veces o quizá nun- 
ca, y por consiguiente se inventan actividades internas para hacer ajus- 
tes. No es sorprendente que los modernos psicólogos cognitivos hayan 
sido influenciados en gran medida por la teoría de la información, en 
que se afirma que un sistema convierte el input en output adquiriendo, 
procesando, almacenando y rememorando la información. Las activi- 
dades de este tipo son versiones modernas de los sustitutos de Tolman 
de los procesos mentales. Aunque Tolman insistía en que sus determi- 
nantes de la conducta debían “descubrirse, en última instancia, median- 
te experimentos” y en que “tienen que inferirse a partir de la conduc- 
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ta”, no obstante los convirtió en su objeto principal de investigación, 
marcando así la pauta de la psicología cognitiva. 

Para los psicólogos de la escuela del estimulo-respuesta, la respues- 
ta constituye el ouput y el estímulo el input, y cuando uno no puede 
explicarse en función del otro deben inventarse de nuevo actividades 
mediadoras. (Los peligros que ello entraña se ponen de manifiesto en 
el hecho de que los dos principios de Hull, la interacción neural afe- 
rente y la oscilación conductual, no desempeñan otra función que ex- 
plicar la imposibilidad de relacionar los acontecimientos terminales 
objetivos de una forma significativa.) Las propiedades del sistema me- 
diador de Hull debían también inferirse a partir de medidas ambienta- 
les, pero el mismo Hull empezó a insertar referencias al sistema ner- 
vioso. 

La conducta de los organismos a veces es situado, de forma erró- 
nea, en la tradición del estimulo-respuesta. El libro sigue la línea traza- 
da en mi artículo de 1981 en el que el estimulo no ocupaba un lugar 
especial entre las variables independientes. Las contingencias más sim- 
ples implican al menos tres términos —estímulo, respuesta y reforza- 
dor— y al menos se implica otra variable (la privación asociada con 
el reforzador). Esto supone mucho más que inputs y outputs, y cuando 
se toman en consideración todas las variables relevantes, no hay nece- 
sidad de recurrir a un aparato interno, ya sea mental, fisiológico o con- 
ceptual. Las contingencias son suficientes para explicar la atención, el 
recuerdo, el aprendizaje, el olvido, la generalización, la abstracción y 
muchos otros de los procesos llamados cognitivos. De la misma forma 
que las historias de saciedad y de privación toman el lugar de los im- 
pulsos interiorizados, los programas de reforzamiento explican las 
probabilidades sostenidas de respuesta atribuidas corrientemente a dis- 
posiciones o rasgos, y ast sucesivamente. 

Las características de esta formulación se hacen más significativas 
a medida que pasamos del marco en que fue elaborada a la historia 
posterior. Es instructivo examinar un reciente número del Journal of 
the Experimental Analysis of Behavior o el libro Operant Behavior: 
Areas of Research and Application. Los registros acumulativos de La 
conducta de los organismos, que aspiran a mostrar los cambios orde- 
nados en la conducta de los organismos individuales, causaron cierta 
sorpresa y, posiblemente, en algunos sectores, despertaron sospechas. 
Actualmente, muchos de ellos parecen burdos. La mejora del control 
experimental ha hecho que las curvas sean mucho menos bruscas. Ac- 
tualmente, los registros acumulativos también se complementan, a me- 
nudo, con distribuciones de los tiempos entre respuestas y con el proce- 
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samiento por ordenador de los cambios de frecuencia. Al “organismo” de 
mi obra, la rata de laboratorio, se le han sumado un sinnúmero de otras 
especies, entre ellas el hombre. La palanca ha cedido su lugar a un 
instrumental apropiado a muchas otras topografías de conducta. Las 
variables independientes son manipuladas con mucho más cuidado: los 
zumbadores y las luces son reemplazados a menudo por estímulos con- 
trolados- con la precisión característica de la psicofísica humana. A la 
comida y al agua se les han añadido otros reforzadores positivos y nega- 
tivos. Los reforzadores nevatigos han abierto un nuevo terreno al 
estudio de la evitación, el escape y el castigo. La cafeína y la benzen- 
drina han resultado ser solamente el principio de una larga lista de 
drogas “psicotrópicas”. 

A medida que ha aumentado la capacidad de análisis, se han estu- 
diado conductas cada vez más complejas, bajo contingencias que se 
aproximan a la sutilidad y complejidad de las contingencias que ha- 
llamos en el ambiente cotidiano. Se analiza todo lo que el organismo 
hace en un momento determinado. Estímulos múltiples y respuestas 
múltiples forman complejos sistemas de operantes concurrentes y enca- 
denadas. Los experimentos pueden durar semanas en vez de la hora 
normal de La conducta de los organismos. Desde el nacimiento se pue- 
den mantener ambientes especiales. El instrumental requerido para 
todo ello es necesariamente mucho más elaborado: los simples relés, 
temporizadores y contadores han dado paso a circuitos integrados y 
ordenadores. Todos estos avances han sido facilitados por una formu- 
lación que hacía resaltar la conducta en lugar de los supuestos precur- 
sores de la conducta y las variables observables en vez de los estados o 
procesos causales inferidos. 

Gran parte de la investigación básica actual constituye esencialmen- 
te una aplicación tecnológica. El estudio del control por estímulos, por 
ejemplo, ha establecido una especie de psicofísica no verbal. Una ex- 
tensa aplicación a la fisiología parece confirmar el argumento del Capí- 
tulo 12 según el cual la conducta “mediatizada” por el sistema nervioso 
tiene que ser descrita rigurosamente antes de que pueda considerarse 
adecuada una explicación neurológica. La investigación operante de- 
sempeña un importante papel en psicofarmacología. Las técnicas tam- 
bién se aplican con una frecuencia creciente a lo que podría llamarse 
biología de la conducta, a veces ante la sorpresa de los etólogos. 
Muchas de estas aplicaciones de las técnicas de un análisis experimen- 
tal han supuesto, asimismo, un generoso apoyo a la investigación básica. 

Otras aplicaciones están más en línea con una tecnología conduc- 
tual. Hacia el final del libro señalaba que se habían evitado las extra- 
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polaciones a los asuntos humanos (“Dejadlo extrapolar a voluntad”), 
pero, en aquel momento, me encontraba ya trabajando en su aplicación 
a la conducta verbal. Mi libro sobre ese tema, publicado casi veinte 
años más tarde, no siempre ha sido comprendido por los lingiiistas y 
los psicolingiistas, pero a mi juicio constituye un paso esencial para 
la prolongación del análisis a la conducta humana. En la educación se 
ha hecho una importante aplicación —tanto verbal como no verbal—. 
Si se puede definir la enseñanza como la disposición de las contingen- 
cias de reforzamiento bajo las que los estudiantes aprenden, las diver- 
sas piezas de los aparatos usados en el análisis experimental de la con- 
ducta son máquinas de enseñar. Muchos procesos analizados en Verbal 
Behavior, particularmente en el capítulo sobre “Estimulación comple- 
mentaria”, son básicos para la enseñanza verbal programada. Un ejem- 
plo primerizo de “modelamiento” de la conducta confeccionando un 
programa de contingencias cada vez más complejas aparece en las 
páginas 339-340. 

La aplicación a la psicoterapia aún no se halla avanzada, aunque 
el trabajo de avanzadilla de O. R. Lindsley ha sido seguido por muchos 
otros estudios sobre sujetos psicóticos y retrasados. Lindsley ha desa- 
rrollado la noción de “ambiente protético”, ambiente destinado a que 
una persona pueda vivir en él eficazmente a pesar de sus deficiencias 
conductales. Pero todos los ambientes artificiales son protéticos en el 
sentido que facilitan o, en otras palabras, estimula ntipos específicos 
de conducta. Mi interés en la creación de una cultura —en el sentido 
amplio del término— me hizo cultivar la literatura en Walden dos,* 
obra en la que se discutían muchos problemas suscitados por la posi- 
bilidad de una eficaz ciencia de la conducta. 

En lo que respecta a los hechos, La conducta de los organismos 
está superado. Sin embargo, me parece que todavía es un libro viable, 
por cuanto presenta una formulación útil de la conducta, avalada por 
una selección de experimentos ilustrativos. También puede servir como 
recordatorio de que una prometedora concepción de la conducta hu- 
mana ha derivado de un análisis que empezó con organismos simples 
en situaciones simples y que avanzó, pero sólo cuando se lo permitió 
su poder de crecimiento, hasta abarcar las complejidades del mundo 
en general, 


Cambridge, Massachusetts. 
Junio de 1966. 


B. F. SkINNER 


2. Editorial Fontanella, Barcelona, 1968, (N. del T.) 
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1. Un sistema de conducía 


La conducta como dato científico 


Aunque la clase de dato al que se refiere una ciencia de la conduc- 
ta es uno de los más comunes de la experiencia humana, sólo reciente- 
mente ha venido a ser considerado sin reservas como un objeto de estu- 
dio científico válido. No es que el hombre nunca haya hablado de la 
conducta ni haya tratado de sistematizarla y describirla, sino que siem- 
pre lo ha hecho de forma indirecta. La conducta presenta un tipo de 
complejidad y de complicación que desalienta una descripción simple 
y en ella florecen abundantemente conceptos explicativos mágicos. Los 
sistemas primitivos de conducta marcaron primero la pauta colocando 
a la conducta del hombre bajo la dirección de entidades situadas más 
allá del mismo hombre. La determinación de la conducta como objeto 
de investigación científica quedaba así descartada, ya que las fuerzas 
rectoras a las que se recurría eran por hipótesis inescrutables o al me- 
nos sólo exigían una explicación de forma muy débil. En sistemas de 
conducta más avanzados, la dirección y el control últimos han sido 
asignados a entidades situadas dentro del organismo, denominadas 
psíquicas o mentales, Nada se gana con esta estratagema, pues muchas, 
si no todas, las propiedades determinantes de la conducta original de- 
ben asignarse a la entidad interna, que se convierte, por decirlo así, en 
otro organismo por derecho propio. Sin embargo, a partir de este pun- 
to de arranque son posibles tres caminos. El organismo interno puede 
llamarse libre resignadamente, como en el caso del “libre albedrío”, 
cuando no resulta posible ninguna investigación ulterior. O bien, pue- 
de definirse tan vagamente que no sea capaz de despertar la curiosi- 
dad de nadie, como cuando el hombre de la calle explica fácilmente su 
conducta recurriendo a un “yo” rector pero no se pregunta ni cree 
necesario explicar por qué el yo se comporta como lo hace. O bien, 
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puede convertirse a su vez en el objeto de estudio de una ciencia. Al- 
gunas concepciones de la “mente” y de sus facultades, y más reciente- 
mente, el “ego”, el “superego” y el “id”, son ejemplos de agentes inter- 
nos u organismos, destinados a explicar la conducta, que han seguido 
siendo objeto de investigación científica. 

El importante avance que supone este nivel de explicación, logrado 
al señalar el sistema nervioso como entidad de control, desgraciadamen- 
te ha tenido también el efecto de desalentar un ataque descriptivo 
directo sobre la conducta. El cambio supone un avance porque la nueva 
entidad más allá de la conducta a la que se recurre tiene un estatuto 
físico definido y es susceptible de investigación científica. Su principal 
función con respecto a la ciencia de la conducta, sin embargo, consiste, 
una vez más, en desviar la atención de la conducta como objeto. El 
uso del sistema nervioso como explicación ficticia de la conducta era 
práctica común aun antes de Descartes, y actualmente es mucho más 
corriente de lo que generalmente se cree. A un nivel popular se dice 
que un hombre es capaz de (un hecho sobre su conducta) porque tie- 
ne cerebro (un hecho sobre su sistema nervioso). Tanto si esta afirma- 
ción tiene algún sentido para la persona que la hace como si no, ello 
carece de importancia; en ambos casos ejemplifica la práctica de ex- 
plicar un hecho obvio (aunque inorganizado) recurriendo a algo sobre 
lo que se sabe poco. Las concepciones neurológicas más complejas ge- 
neralmente están de acuerdo con el punto de vista popular al afirmar 
que la conducta en sí es incomprensible, pero que puede reducirse a 
leyes si se puede demostrar que es controlada por un sistema interno 
susceptible de tratamiento científico. Los hechos sobre la conducta 
no son estudiados por sí mismos, sino que se consideran como algo 
que puede explicarse y aun justificarse por los hechos anteriores del 
sistema nervioso. (No estoy intentando rebajar la importancia de la 
ciencia de la neurología, sino que me refiero simplemente al uso pri- 
mitivo del sistema nervioso como principio explicativo, evitando una 
descripción directa de la conducta.) 

La investigación de la conducta como dato científico por derecho 
propio sobrevino más gracias a una reforma de las ficciones psíquicas 
que neurológicas. Históricamente, supuso tres interesantes etapas, que 
a menudo han sido descritas y pueden resumirse de la forma siguiente: 
Darwin, insistiendo en la continuidad de la mente, atribuyó facultades 
mentales a algunas especies subhumanas. Lloyd Morgan, con su ley 
de la parsimonia, prescindió de ellas en ima tentativa razonablemente 
fructífera de explicar la conducta animal característica sin su concur- 
so. Watson utilizó la misma técnica para explicar la conducta humana 
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y restablecer la deseada continuidad de Darwin sin necesidad de dar 
por supuesta la mente. Así fue como nació una ciencia de la conducta, 
pero bajo circunstancias que apenas pueden considerarse propicias. 
La ciencia apareció bajo la forma de una psicología remoldeada con 
evidencias mal encubiertas de su antiguo marco. Aceptó una organi- 
zación de datos basada en antiguos conceptos que no constituían una 
parte esencial de su propia estructura. Heredó un lenguaje tan imbuido 
de metáforas e implicaciones que con frecuencia era imposible hablar 
simplemente sobre la conducta sin despertar los fantasmas de sistemas 
muertos. Peor aún, favoreció la práctica de buscar una solución para 
los problemas de la conducta en otras áreas distintas de la conducta. 
Cuando la ciencia de la conducta consiguió desembarazarse de las fic- 
ciones psíquicas, se enfrentó con esas alternativas: o bien podría dejar 
sus lugares vacíos y proceder a tratar sus datos directamente, o bien 
podría hacer sustituciones. El peso entero del hábito y de la tradición 
abogaba por la sustitución. La alternativa demasiado obvia a la ciencia 
mental era una ciencia neural, y ésa era la elección hecha por una 
psicología no-mentalista. La posibilidad de una ciencia de la conducta 
directamente descriptiva y sus peculiares ventajas recibieron poca 
atención. 

La necesidad de una ciencia de la conducta debería aparecer con 
claridad para todo aquel que se halle preocupado por el papel de la 
conducta en los asuntos humanos. En efecto, la necesidad es tan obvia 
y tan grande que ha actuado más bien en el sentido de desalentar en 
vez de estimular el establecimiento de dicha ciencia. Debido en gran 
parte a sus tremendas consecuencias, un riguroso tratamiento de la con- 
ducta aún se considera en muchos sectores como imposible. El objeti- 
vo parece totalmente inaccesible. Probablemente, nadie está preparado 
para decir cuál sería el éxito eventual de dicha ciencia; pero los pro- 
blemas preliminares al menos no están fuera del alcance de los méto- 
dos y prácticas científicas existentes, y abren una de las perspectivas 
más interesantes de la ciencia moderna. 

Las dos cuestiones que inmediatamente se nos presentan son: ¿Cuál 
será la estructura de una ciencia de la conducta? ¿Hasta qué punto 
sus leyes pueden ser válidas? Estas cuestiones representan suficiente- 
mente bien el doble campo del presente libro. Estoy interesado, en pri: | 
mer lugar, en establecer un sistema de conducta en cuyos términos 
puedan enunciarse los hechos de una ciencia y, en segundo lugar, en 
verificar el sistema experimentalmente en algunos de sus puntos más 
importantes. En el presente capítulo voy a esbozar lo que me parece 
la formulación más conveniente de los datos en la actualidad, y en los 
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últimos capítulos consideraré algunos materiales factuales que se ajus- 
ten a este esquema. Si el lector está principalmente interesado en los 
hechos y métodos experimentales, puede pasar directamente al capítulo 
segundo, y usar el índice para clarificar de vez en cuando los términos 
definidos en las páginas siguientes. Si está interesado en la estructura 
de una ciencia de la conducta y desea comprender por qué se realiza- 
ron los experimentos contenidos en este libro, el tratamiento teórico 
del resto de este capítulo es indispensable. 


Una definición de la conducta 


Es necesario empezar com una definición. La conducta sólo consti- 
tuye una parte de la actividad total de un organismo, y se requiere 
por tanto cierta delimitación formal de la misma. El campo puede 
definirse históricamente con arreglo a un interés establecido. A dife- 
rencia de otras actividades del organismo, los fenómenos de la conduc- 
ta se caracterizan por su calidad de manifiestos. La conducta es lo 
que un organismo hace, o de forma más rigurosa, lo que otro organis- 
mo observa que hace. Pero decir que una simple muestra de actividad 
cae dentro del campo de la conducta simplemente porque normalmen- 
te está bajo observación supondría interpretar mal la significación de 
esta propiedad. Es más apropiado decir que la conducta es aquella 
parte del funcionamiento de un organismo que consiste en actuar o 
en relacionarse con el mundo exterior. Las propiedades peculiares que 
hacen que la conducta sea un campo de estudio unitario y único deri- 
van de esta definición. Sólo a causa de que los receptores de otros 
organismos son las partes más sensibles del mundo externo, podemos 
nosotros con cierto éxito hacer apelación a un interés preestablecido 
por lo que un organismo hace. 

Así, pues, por conducta entiendo simplemente el movimiento de 
un organismo o de Sus partes dentro de un marco de referencia sumi- 
nistrado por el mismo organismo o por varios objetos externos o cam- 
pos de fuerza. Es conveniente hablar de ella como de la acción del 
organismo sobre el mundo exterior, y a veces es deseable observar un 
efecto en lugar del mismo movimiento, como en el caso de la produc- 
ción de sonidos, 


Un conjunto de términos 


Al abordar un campo así definido con objeto de una descripción 
científica tropezamos ante todo con la necesidad de un conjunto de 
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términos. Muchas lenguas están bien equipadas a ese respecto, pero 
eso no supone ninguna ventaja. En inglés, por ejemplo, decimos que un 
organismo ve o siente objetos, oye sonidos, gusta sustancias, huele olo- 
res y que le gustan o le disgustan; quiere, busca y encuentra; tiene un 
propósito, prueba algo y lo logra o fracasa; aprende y recuerda u 
olvida; está asustado, enojado, feliz o deprimido; dormido o despierto; 
y así sucesivamente. Debemos evitar la mayor parte de esos términos 
en una descripción científica de la conducta, pero no por las razones 
que usualmente se dan. No es cierto que no puedan definirse. Aun 
dando por sentado que en sus usos generalmente aceptados no resis- 
ten el análisis, no obstante es posible ponernos de acuerdo sobre lo 
que queremos decir con “ver un objeto” o “querer una bebida” y res- 
petar el acuerdo a partir de aquel m. nento. Se podría establecer un 
conjunto de definiciones convencionales sin salirnos de la conducta, y 
de hecho fue establecido por los primeros conductistas, que malgasta- 
ron mucho tiempo —creo que inútilmente— tratando de traducir en 
términos conductistas los conceptos de la psicología tradicional, mu- 
chos de los cuales se habían tomado de la lengua vernácula. Tolman (71), 
por ejemplo, ha hecho denodados esfuerzos para redefinir algunos tér- 
minos del vocabulario popular con referencia a la conducta. 
Asimismo, no es cierto que la conducta designada por un vocabu- 
lario de este tipo no puede tratarse de una forma cuantitativa. Los tér- 
minos normalmente se refieren a continuos (un organismo ve claramen- 
te, vagamente o nada en absoluo, algo le gusta o le disgusta más o 
menos intensamente, hace repetidos intentos o intentos escasos, apren- 
de rápida o lentamente, etc.), y una vez definidos con respecto a la 
conducta pueden expresarse en unidades no menos arbitrarias que los 
centímetros, gramos y segundos, y acaso incluso reductibles a ellos. 
La objeción importante a la lengua vulgar en la descripción de la 
conducta es que muchos de sus términos implican esquemas concep- 
tuales. No quiero dar a entender con ello que una ciencia de la con- 
ducta deba prescindir de un esquema conceptual, sino que no debe 
servirse de los esquemas subyacentes al lenguaje popular sin una mi- 
nuciosa consideración de los mismos. El lenguaje popular es tosco y 
basto; sus términos cabalgan unos sobre otros, hacen distinciones in- 
necesarias o irreales, y están lejos de ser los más convenientes para 
tratar los datos. Tienen la desventaja de ser productos históricos, intro- 
ducidos a causa de la conveniencia cotidiana en vez de aquel tipo es- 
pecial de conveniencia característico de un sistema científico simple. 
Sería un milagro si este conjunto de términos fuera apropiado para 
una ciencia de la conducta, y en este caso no se ha producido ningún 
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milagro. Solamente hay una forma de obtener un sistema útil y con- 
veniente y consiste en ir directamente a los datos. 

Esto no significa que debamos abandonar enteramente el lenguaje 
ordinario en una ciencia de la conducta. El único criterio para el re- 
chazo de un término popular es la implicación de un sistema o de una 
formulación que se extienda más allá de las observaciones inmediatas. 
Podemos libremente conservar todos los términos descriptivos de la 
conducta sin implicaciones sistemáticas. Así, el término “probar” debe 
rechazarse porque implica la relación de una muestra dada de conduc- 
ta con acontecimientos pasados o futuros; pero el término “andar” debe 
retenerse porque no supone dicha implicación. El término “ver” debe re- 
chazarse; pero “mirar hacia adelante” debe conservarse, porque “ver” 
implica más que volver los ojos hacia una fuente de estimulación o más 
que una simple recepción de estímulos. Es posible que algunos térmi- 
nos sistemáticos populares se apliquen al sistema científico finalmente 
establecido. Podríamos querer establecer una relación semejante a la 
denotada por “probar” y en tal caso podríamos reintroducir el térmi- 
no. Pero los puntos de contacto entre un sistema popular y científico 
presumiblemente no serán muchos, y en todo caso el término popular 
debe omitirse hasta que se haya establecido su justificación sistemática. 

Con este criterio es posible preservar una considerable parte de la 
lengua vernácula para su uso en la descripción de los movimientos de 
los organismos. Cuando la lengua popular es vaga, puede complemen- 
tarse con términos de la anatomía y de la fisiología superficial, y, si es 
preciso, pueden inventarse nuevos términos. 


Narración y reflejo 


Una vez en posesión de un conjunto de términos podemos proceder 
a una especie de descripción de la conducta dando un relato dinámico de 
una muestra de conducta a medida que se desenvuelve en un marco 
de referencia. Este método es típico de la historia natural y se emplea 
extensamente en el trabajo corriente, por ejemplo, en la conducta in- 
fantil. Lo podemos denominar narración. No presenta ningún problema 
especial. Si existe alguna objeción al uso de una descripción verbal, el 
investigador puede recurrir a filmes sonorizados y multiplicarlos a vo- 
luntad. La perfección de la transcripción sólo se verá limitada por una 
eventual incapacidad para incrementar el número de dispositivos de 
registro. A partir de los datos obtenidos de esta forma, es posible cla- 
sificar los diferentes tipos de conducta y determinar sus relativas fre- 
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cuencias de ocurrencia. Pero aunque, propiamente hablando, esto es 
una descripción de la conducta, no constituye una ciencia en el sentido 
aceptado del término. Tenemos que ir más allá de la mera observación 
hasta conseguir un estudio de las relaciones funcionales. Necesitamos 
establecer leyes en virtud de las cuales podamos predecir la conducta, 
y eso sólo podemos hacerlo hallando las variables de las que la con- 
ducta es función. 

Podemos hallar un tipo de variable que forma parte de la descrip- 
ción de la conducta observando las fuerzas externas que actúan sobre 
el organismo. Presumiblemente, no es posible mostrar que la totalidad 
de la conducta está en función de la totalidad del ambiente estimulan- 
te. Una relación entre términos tan complejos como esos no se somete 
fácilmente al análisis y quizás nunca puede llegar a demostrarse. El 
ambiente entra a formar parte de una descripción de la conducta 
cuando puede mostrarse que una parte dada de la conducta puede in- 
ducirse a voluntad (o con arreglo a ciertas leyes) por una modificación 
parcial de las fuerzas que afectan al organismo. Esta parte, o modifi- 
cación de una parte, del ambiente se llama tradicionalmente un es- 
tímulo y la parte correlacionada de la conducta una respuesta. Ninguno 
de los dos términos puede definirse en cuanto a sus propiedades esen- 
ciales sin el otro. Para la relación observada entre ellos usaré el término 
reflejo, por razones que irán apareciendo claras a medida que avan- 
cemos. Normalmente, al usar el término, sólo se invoca una propiedad 
de la relación —la estrecha coincidencia de la ocurrencia del estímulo 
y la respuesta—, pero hay otras importantes propiedades que vamos 
a destacar en breve. 

La diferencia entre la demostración de un reflejo y la mera narra- 
ción no reside en que parte del ambiente no puede mencionarse en la 
narración, sino en que no se afirma ninguna relación válida entre él y 
la conducta. En la forma narrativa, por ejemplo, podemos decir que 
“en tal o en cual momento el mono cogió un palo”. De esta forma, no 
se hace referencia a otros casos de la misma conducta, pasados o futu- 
ros. No se afirma que todos los monos cojan palos. Simplemente, se 
cuenta la historia de algo que ha sucedido una vez. El aislamiento de 
un reflejo, por el contrario, constituye la demostración de una unifor- 
midad predictible de la conducta. De una forma u otra es una parte 
inevitable de toda ciencia de la conducta. Podemos emplear otro nom- 
bre, y el grado de rigor de la demostración de sometimiento a leyes 
puede ser inferior al requerido en el caso del reflejo, pero debe des- 
arrollarse la misma actividad fundamental siempre que queremos de- 
cir algo de naturaleza científica sobre la conducta que no sea una sim- 
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ple narración. Las objeciones corrientes al reflejo fundamentadas en 
que en el análisis de la conducta destruimos la misma cosa que tratamos 
de comprender, apenas merecen una respuesta. Siempre analizamos. 
Es de sentido común hacer el acto explícito: efectuar el análisis de 
la forma más manifiesta y más rigurosa posible. 

El reflejo definido de esta manera, por supuesto, no constituye una 
teoría, Es un hecho. Constituye una unidad de análisis que hace posi- 
ble una investigación de la conducta. No es en absoluto un dispositivo 
tan simple como esta breve explicación sugiere, y volveremos más tarde 
a ciertas cuestiones referentes a su uso apropiado. Muchas dificulta- 
des tradicionales se evitan manteniendo la definición a un nivel ope- 
racional. No voy más allá de la observación de una correlación entre 
estímulo y respuesta. La omisión de toda referencia a los acontecimien- 
tos neurológicos puede confundir al lector que está acostumbrado al 
uso tradicional del término en neurología. El problema, creo yo, que- 
dará clarificado en el capítulo 12; pero es conveniente anticipar la 
discusión observando que el concepto no se usa aquí como una “expli- 
cación neurológica” de la conducta. Es un término puramente des- 
criptivo, 

El hecho de que el reflejo como correlación de estímulo y respues- 
ta no es el único elemento a tratar en una descripción de la conducta 
se hará patente más tarde cuando definamos otro tipo de respuesta 
que es “emitida” en vez de “provocada”. La siguiente argumentación 
se limita en gran parte a la conducta provocada. 


La catalogación de los reflejos 


Un paso en la descripción de la conducta lo constituye la demos- 
tración de las relaciones que llamamos reflejos. Aunque acarrea un 
considerable poder de predicción y de control, no es ése, como se ha 
afirmado a menudo, el objeto y el fin del estudio de la conducta. Wat- 
son, por ejemplo, definió el objeto del estudio psicológico como “la 
averiguación de datos y leyes tales que, dado el estímulo, la psicología 
pueda predecir cuál será la respuesta; o, dada la respuesta, pueda 
especificar la naturaleza del estímulo efectivo” ([75], p. 10). Pero tras 
una breve reflexión nos percatamos de que este programa es imprac- 
ticable. En el campo de la conducta una ciencia debe enfrentarse con 
una extraordinaria riqueza de material experimental. El número de 
estímulos a los que puede responder un organismo típico originalmente 
es muy elevado. El número de estímulos a los que puede llegar a res- 
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ponder en virtud de un proceso que será descrito más tarde es inde- 
finidamente grande, y a cada uno de ellos puede hacérsele responder 
de muchas formas. De ello se desprende que el número de reflejos 
posibles para todos los propósitos prácticos es infinito y que lo que 
podríamos llamar la catalogación de los reflejos sería una tarea ingrata. 

Sin embargo, no hay forma de alcanzar el objetivo propuesto por 
esta cita de Watson, tomada al pie de la letra, como no sea catalogando. 
El tipo de predicción que propone requeriría la compilación de un 
catálogo exhaustivo de reflejos, con referencia al cual se pudieran ha- 
cer predicciones. El catálogo serviría sólo para un organismo particular 
y requeriría una revisión continua en tanto el organismo estuviera con 
vida. Evidéntemente, ello es impracticable. Dejando aparte la cuestión 
de su parcialidad, no alcanzaría ningún grado de utilidad antes de 
volverse inmanejable debido a su desmesurado tamaño. Nadie ha in- 
tentado seriamente construir un catálogo para este propósito, y proba- 
blemente he interpretado mal la cita. Los que consideran la predicción 
general como la esencia de la descripción de la conduca han supuesto 
normalmente que es posible reducir el tamaño del campo y alcanzar 
predicciones detalladas por un camino más corto. Pero nunca se ha 
demostrado que algún método hiciera esto posible. Generalmente, se 
hace el intento de reducir el número total de los términos precisos ha- 
ciendo cada término más comprensivo (como valiéndose de clases de 
reflejos). Pero cuanto más comprensivo es el término menos completa 
y menos exacta es su referencia descriptiva en cualquier ocasión deter- 
minada en que se usa. Mostraré más tarde que el nivel de análisis del 
reflejo es determinado únicamente por su utilidad como instrumento 
analítico y que no puede alterarse sólo para reducir del número de 
términos a tener en cuenta. 

No tenemos razones para esperar, ni de consideraciones teóricas ni 
de un examen de lo que se ha hecho experimentalmente, que ninguna 
predicción general de la respuesta o identificación del estímulo sean 
posibles gracias al descubrimiento de principios que eviten la rutina de 
catalogar los reflejos. Confrontados con la expansividad inagotable 
de la topografía de la conducta, debemos inclinarnos ante la imposibi- 
lidad de toda predicción general, que podamos llamar exacta, de los 
estímulos o respuestas. El número de elementos a tener en cuenta es 
considerable y no parece posible proceder a su reducción, por lo que 
no tenemos razones para creer actualmente que algún día sea descu- 
bierta una nueva ordenación que venga a resolver la dificultad. Esta 
concepción puede parecer sombría a aquellos que creen que el estudio 
de la conducta se propone ante todo la predicción topográfica de estí- 
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mulos y respuestas. Pero esta caracterización de su objeto es errónea y 
fatal. En realidad, puede tener escaso interés la continuada demostra- 
ción de relaciones reflejas. El descubrimiento del reflejo constituyó his- 
tóricamente un acontecimiento importante en una época en que el 
campo de la conducta era invadido por muchos otros conceptos des- 
criptivos (usualmente metafísicos). Comprensiblemente puede ser de 
importancia siempre que parezca existir una razón especial para cues- 
tionar la “naturaleza refleja” de un elemento determinado de la con- 
ducta. Pero cuando se han identificado un gran número de reflejos 
y especialmente cuando se ha postulado que toda conducta es refleja, 
la mera catalogación de los reflejos ya no tiene interés teórico y sólo 
sigue siendo importante en investigaciones especiales (como, por ejem- 
plo, el análisis de la postura). Ningún interés en la descripción de la 
conducta nos instigará, por sí mismo, a insistir más en la catalogación 
de los reflejos. 


Las leyes estáticas del reflejo 


He limitado los párrafos precedentes a la predicción topográfica 
de la conducta con objeto de dejar espacio para otra clase de predic- 
ción a la que una ciencia de la conducta debe consagrarse: la pre- 
dicción de las propiedades cuantitativas de los reflejos representativos. 
Al limitar el concepto de reflejo a la coincidencia de ocurrencia de 
un estímulo y una respuesta se introduce una simplificación conside- 
rable; otra simplificación viene dada por la suposición de que la rela- 
ción así descrita es invariable. Es sólo en virtud de esas simplificaciones 
que puede mostrarse que la mera catalogación de los reflejos no posee 
en absoluto ningún valor predictivo, y la argumentación en contra 
de la catalogación como objeto de una ciencia de la conducta podría 
verse considerablemente fortalecida considerando hasta qué punto un 
catálogo vería reducido su valor después de disiparse estas suposicio- 
nes simplificadoras. 

Las propiedades cuantitativas surgen porque tanto el estímulo co- 
mo la respuesta, además de topografía, tienen dimensiones intensivas 
y temporales y debido a que existe una correlación entre los valores 
asumidos en los dos casos. Dado un estímulo sobre el que tenemos un 
control cuantitativo y una medida de la magnitud de la respuesta, es- 
tamos en condiciones de demostrar las leyes siguientes: 


LEY DEL UMBRAL. La intensidad del estímulo debe alcanzar 
o exceder un cierto valor crítico (llamado umbral) para que pueda 
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provocar una respuesta. La existencia de un umbral deriva de la ca- 
pacidad necesariamente limitada del organismo para ser afectado por 
fuerzas externas débiles. Los valores obtenidos en reflejos típicos de 
esta índole son por lo general considerablemente superiores a los valo- 
res sobre la capacidad receptiva básica del organismo determinada 
de otras formas (por ejemplo, en la “discriminación” del capítulo 5). 


LEY DE LATENCIA. Un intervalo de tiempo (llamado latencia) 
transcurre entre el inicio del estímulo y el inicio de la respuesta. Cabe 
esperar una latencia por la separación espacial usual entre el receptor 
y el efector y por la diferencia en la forma de energía del estímulo y 
la respuesta. Los valores obtenidos varían considerablemente entre los 
reflejos, siguiendo hasta cierto punto una clasificación de los recepto- 
res (cf. reflejos visuales y termales) y de los efectores (cf. las respuestas 
de los músculos estriados y de los músculos lisos o glándulas). No se 
requiere ninguna medida de la magnitud del estímulo o de la res- 
puesta para determinar la latencia, con tal que estas magnitudes se 
puedan mantener constantes, y por consiguiente es una medida útil 
cuando las dimensiones de uno u otro término son dudosas. Otra im- 
portante propiedad de la latencia es que generalmente está en función 
de la intensidad del estímulo, como Sherrington mostró originalmente 
([681, pp. 18 y ss). Cuanto más fuerte es el estímulo más corta es la 
latencia. 


LEY DE LA MAGNITUD DE LA RESPUESTA. La magnitud de 
la respuesta está en función de la intensidad del estímulo. Aunque hay 
casos excepcionales que muestran, aparentemente, un carácter de “todo 
o nada”, la magnitud de la respuesta en general es escalonada, y se 
produce una correspondiente gradación en la intensidad del estímulo. 
Las dos magnitudes se miden en escalas separadas apropiadas a la 
forma de cada término, pero ello no es óbice para la demostración de 
una relación. La razón de las magnitudes será designada de ahora en 
adelante como la razón R/S.! 


LEY DE LA POSTDESCARGA. La respuesta puede persistir 
durante algún tiempo después del cese del estímulo. El término de 


1. Un aumento de la intensidad del estímulo puede provocar no sólo un 
aumento de la respuesta sino también un cambio aparente de topografía. Así, un 
ligero shock en el pie puede ocasionar una simple flexión, mientras que un shock 
fuerte puede provocar respuestas posturales vigorosas y progresivas. Esos efectos 
pueden estudiarse tratando por separado cada respuesta y observando que los 
umbrales difieren. Un solo estímulo se correlaciona con todos ellos pero provoca 
una respuesta dada sólo cuando está por encima de su valor de umbral particular. 


27 


postdescarga generalmente no se aplica exclusivamente al tiempo sino 
a la cantidad total de actividad que tiene lugar durante el mismo. En 
general la postdescarga aumenta con la intensidad del estímulo. Al me- 
dir la diferencia entre los tiempos de cesación, la latencia puede sus- 
traerse como un refinamiento menor. 

Los enunciados precedentes consideran la intensidad del estímulo 
como la única propiedad en función de la cual está la respuesta, pero 
la duración no debe ignorarse. Las leyes están sometidas a la siguiente 
elaboración : 


LEY DE LA SUMACIÓN TEMPORAL. La prolongación de un 
estímulo o la presentación repetitiva del mismo dentro de ciertas tasas 
limitadas tiene el mismo efecto que el incremento de su intensidad. 
La sumación a menudo se restringe a los valores del estímulo cercanos 
al umbral, cuando el efecto que se desea es obtener una respuesta que 
no se provoca sin Sumación, pero la ley se aplica a la magnitud de la 
respuesta, su latencia, etc., así como a su mera ocurrencia. De esta 
forma, el valor de un estímulo inferior al umbral puede provocar una 
respuesta si se prolonga o repite durante cierto tiempo o con cierta 
frecuencia, y la magnitud de la respuesta y la postdescarga están en 
función de la duración del estímulo, así como de su intensidad. La la- 
tencia es frecuentemente demasiado corta para verse afectada por 
la prolongación del estímulo, pero en los valores de estímulo cercanos 
al estímulo débil, la latencia está en función de la frecuencia de pre- 
sentación.? 


Las propiedades de la latencia, del umbral, de la postdescarga y 
la razón R/S se detectan presentando un estímulo de varias intensi- 
dades y duraciones y observando el tiempo de ocurrencia, duración y 
magnitud de la respuesta, las cuales pueden denominarse propiedades 
estáticas del reflejo. Complementan a una descripción topográfica de for- 
ma importante y no pueden omitirse en una descripción adecuada. Pero 
debemos distinguirlas de un grupo más extenso de leyes que se refieren a 
los cambios en el estado de las propiedades estáticas. Empiezan a obser- 


2. El estímulo sumado puede ocasionar cambios topográficos semejantes a los 
que siguen a un aumento de la intensidad del estímulo. Si se toca el pabellón 
de la oreja de un perro que está durmiendo, el perro puede sacudirla; pero si 
se la toca repetidamente, el perro puede agitarse y cambiar de posición. Lo que 
ha sucedido debe tratarse como en el caso del incremento de intensidad. El 
reflejo de cambiar de posición tiene un umbral más alto que el reflejo del pabellón 
de la oreja y puede presentarse sólo con un estímulo más fuerte o mediante la 
sumación de estímulos. 
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varse cambios cuando repetimos la provocación de un reflejo, lo cual no 
podemos dejar de hacer si queremos comprobar nuestras mediciones 
o dar una descripción de la conducta a lo largo de un período de 
tiempo prolongado. Los valores de las propiedades estáticas de un re- 
flejo se ven confirmadas exactamente raras veces, O casi nunca, a lo 
largo de provocaciones sucesivas. Tienen lugar importantes cambios 
bien en el tiempo o bien en función de ciertas operaciones ejecutadas 
sobre el organismo. Estos cambios pueden ser descritos apelando a 


otro tipo de leyes que distinguiré de las precedentes llamándolas di- 
námicas. 


Las leyes dinámicas de la fuerza del reflejo 


En un ejemplo de ley dinámica presentado más adelante (Ley de 
la Fatiga del Reflejo) se afirma que, si se provoca repetidamente un 
reflejo a un cierto ritmo, su umbral Sube, su latencia se incrementa y 
la razón R/S y la postdescarga disminuyen [Sherrington (68)]. La ope- 
ración que se ejecuta sobre el organismo en este caso es simplemente 
la repetida provocación del reflejo. Su efecto es un cambio simultáneo 
en los valores de todas las propiedades estáticas. La ley debiera des- 
cribir la relación existente entre cada propiedad y la operación, pero 
es conveniente tener un solo término para designar el estado del refle- 
jo con respecto a todas sus propiedades estáticas a la vez. Varios tér- 
minos se utilizan corrientemente para ello como son “intensidad”, Epo- 
tencia” y “fuerza”. Usaré “fuerza”. El valor de la fuerza de un reflejo 
se asigna arbitrariamente al mismo a partir de los valores de las pro- 
piedades estáticas y nunca se mide directamente. 

La fuerza de un reflejo no debe confundirse con la magnitud de la 
respuesta. Esta última está en función de la intensidad del estímulo, 
con el que la fuerza de un reflejo no guarda relación. Un reflejo fuerte 
puede presentar una respuesta de escasa magnitud si el estímulo es 
de baja intensidad; inversamente, un reflejo débil puede presentar una 
respuesta bastante intensa a un estímulo muy intenso. Reservaré el tér- 
mino de fuerza exclusivamente para el significado que le he atribuido 
aquí y utilizaré “intensidad” o “magnitud” para referirme a los valores 
de estímulos y respuestas. 


El estado del reflejo está en función de la operación de la provoca- 
ción en dos leyes de la fuerza del reflejo. Los cambios van en la misma 
dirección, pero difieren en sus propiedades temporales. 
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LEY DE LA FASE REFRACTARIA. Inmediatamente después de 
la provocación, la fuerza de algunos reflejos tiene un valor muy bajo, 
cercano al cero. Vuelve a su estado anterior durante la inactividad 
subsiguiente. El período durante el cual el valor es cero se llama 
“fase refractaria absoluta”; aquel durante el cual está por debajo de lo 
normal, “fase refractaria relativa”. Las duraciones varían considerable- 
mente entre los reflejos pero pueden ser del orden de una fracción de 
segundo para la fase absoluta y de unos pocos segundos para la relativa. 

La fase refractaria se aplica sólo a un tipo de reflejo en que la res- 
puesta utiliza un efector de formas opuestas en tiempos diferentes. Esta 
respuesta es dinámica o fásica. Los ejemplos clásicos son el reflejo de 
rascado en el perro y el reflejo de parpadeo en el hombre, los cuales im- 
plican flexiones y extensiones alternas. La simple flexión de la pierna o 
el cierre del ojo implican el primero de esos movimientos opuestos y no 
tienen fase refractaria; la segunda presentación del estímulo sólo resta- 
blece, prolonga o intensifica la respuesta. La fase refractaria puede con- 
siderarse como un mecanismo especial para la producción y soporte de 
ritmos y respuestas que deben cesar y empezar de nuevo con objeto de 
desempeñar sus funciones. Véanse datos sobre la fase refractaria en (35). 


LEY DE LA FATIGA DEL REFLEJO. La fuerza de un reflejo 
desciende durante la provocación repetida y vuelve a su valor anterior 
durante la inactividad subsiguiente. La tasa de descenso está en fun- 
ción de la tasa de provocación y de la intensidad del estímulo (y por con- 
siguiente de la respuesta) y varía grandemente entre los reflejos. A causa 
de los procesos conflictivos de descenso y restablecimiento, la fuerza pue- 
de estabilizarse en un valor constante como función de la tasa de provo- 
cación. En las tasas altas la fuerza puede alcanzar el valor cero. Algunos 
reflejos son prácticamente infatigables como, por ejemplo, los reflejos 
posturales suscitados a partir de la cabeza, como ha sido mostrado por 
Magnus (61). 

La ley de la fatiga del reflejo se opone directamente a la noción de 
“canalización” en la que se afirma que la provocación incrementa la 
fuerza del reflejo. El concepto de canalización ha sido asociado con 
varias teorías del aprendizaje y la llamada Ley del Ejercicio. No tene- 
mos ocasión de introducirla aquí, y la ley de la fatiga puede, por lo tanto, 
mantenerse sin excepción. Hay operaciones a través de las cuales puede 
aumentarse la fuerza de un reflejo, pero la simple provocación no cons- 
tituye una de ellas. 

Cuando la fatiga se produce rápidamente y el restablecimiento es 
lento, el proceso se denomina, a menudo, “adaptación”. Así, ciertos re- 
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flejos a sonidos altos pueden fatigar (“adaptarse”) bastante rápidamente 
y mantenerse en una fuerza cero o muy baja durante períodos conside- 
rables. El tiempo requerido para restablecer la fuerza original gracias 
a la inactividad puede ser del orden de meses o años. La adaptación o 
la fatiga se distinguen sólo por sus propiedades temporales y serán 
consideradas aquí como ejemplos del mismo fenómeno. 


Las próximas leyes dinámicas que vamos a considerar implican la 
operación de presentar un segundo estímulo, El estímulo extraño no 
tiene, por sí mismo, control sobre la respuesta, pero afecta a la fuerza 
del reflejo del que la respuesta forma parte. 


LEY DE FACILITACIÓN. La fuerza de un reflejo puede incre- 
mentarse mediante la presentación de un segundo estímulo que en sí 
no provoca la respuesta. 

En el experimento original de Exner (41) la fuerza de un reflejo de 
flexión en un conejo (observada como la magnitud de la respuesta a 
un estímulo de intensidad constante) era incrementada por un sonido 
alto y por otros estímulos intensos. Un sonido alto es un estímulo faci- 
litador común, pero su acción facilitativa queda reducida a ciertos tipos 
de reflejos, especialmente esqueléticos. Puede tener un efecto opuesto 
sobre un reflejo como la salivación (ver párrafo próximo). La cláusula 
calificativa de la ley, la que afirma que el estímulo en sí no provoca 
la respuesta, es precisa para distinguir entre la facilitación y un proceso 
llamado sumación temporal, que describiremos más tarde. La facilita- 
ción a veces se define de tal forma (27) que se aplica sólo a la eleva- 
ción de la fuerza a partir de cero, es decir, a la producción de una res- 
puesta en casos en que anteriormente no era posible. Pero éste es sólo 
un caso especial de lo que hemos definido de forma más general. 


LEY DE INHIBICIÓN. La fuerza de un reflejo puede decrecer 
mediante la presentación de un segundo estímulo que no tiene ninguna 
otra relación con el efector en cuestión. 

El término inhibición se ha usado de forma vaga para designar todo 
descenso de la fuerza del reflejo o el estado disminuido resultante. Dos 
de las leyes ya enumeradas (la de la fase refractaria y la de la fatiga 
del reflejo) se han citado como casos de inhibición por Sherrington, y 
más tarde daremos ejemplos extraídos de otros autores. En el sistema 
que presentamos, en el que muchos de los fenómenos más importantes 
se definen en términos de cambios de fuerza, un término tan amplio 
no tiene utilidad. Todos los cambios de fuerza tienen fases negativas, 
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pero también positivas; la propiedad de la mera dirección del cambio 
no establece una clase útil de datos. Los diversos cambios incluidos en 
la clase pueden distinguirse fácilmente teniendo en cuenta las opera- 
ciones que los producen, y se gana bien poco dándoles un nombre 
común. Ñ 

Un tipo de cambio negativo de fuerza tiene cierto derecho histó- 
rico sobre el término inhibición. La operación consiste en la presenta- 
ción de un estímulo que no afecta por sí mismo a la respuesta en 
cuestión, y la ley es, por lo tanto, idéntica a la de la facilitación excep- 
tuando su signo. Agrupando las dos leyes podemos decir que un tipo 
de cambio de fuerza se debe a la simple presentación de estímulos 
extraños y que puede ser positivo (facilitación) o negativo (inhibición). 
Este sentido estricto del término inhibición es el único que utilizaré 
y su diferencia con el enfoque tradicional puede quizás clarificarse 
contrastando los dos pares de términos “inhibición-*facilitación” e “in- 
hibición-excitación”. En el segundo par la inhibición se refiere a cual- 
quier estado de fuerza bajo o al proceso necesario para alcanzarlo. No 
necesitamos el término porque no necesitamos su contrario. La excita- 
ción y la inhibición se refieren a lo que aquí se considera como un 
continuum de grados de fuerza del reflejo, y no tenemos necesidad 
de designar sus dos extremos. En el primer par, por el contrario, la 
inhibición se refiere a un cambio negativo de fuerza producido por un 
tipo de operación que acarrearía un cambio positivo bajo otras cir- 
cunstancias. 

Existe un peligro evidente en conceptos emparejados de esta indo- 
le, pues colocan a un sistema bajo la sospecha de estar destinado a 
englobar un dato esté donde esté. Sin embargo, en nuestro caso, no 
afirmamos que los estímulos extraños afectan a la fuerza del reflejo 
de una forma o de otra. Las leyes de la facilitación y de la inhibición 
se refieren a estímulos y reflejos específicos, y está implícito que la 
dirección del cambio es capaz de especificación en cada caso. 


Las cuatro leyes dinámicas que acabo de exponer constituyen ejem- 
plos clásicos. Pueden complementarse con leyes que expresan los efec- 
tos de la administración de drogas, de cambios en la presión de oxíge- 
no, etc., que también han sido mencionadas en los tratados clásicos 
(39), pero creo que son suficientes, en este momento, para ejemplificar 
la estructura del sistema. Empiezo con el reflejo como descripción 
empírica de la relación topográfica entre un estímulo y una respuesta. 
Las leyes estáticas constituyen la descripción cuantitativa. El enuncia- 
do de un reflejo y sus leyes estáticas predicen parte de la conducta del 
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organismo apelando a las fuerzas estimulantes que la producen. Las 
leyes dinámicas permiten expresar la importancia de otras clases de 
operaciones que afectan a la misma conducta, con el fin de que la 
descripción sea válida en todos los tiempos. 

En el curso de este libro trataré de mostrar que una gran cantidad 
de material generalmente no considerado bajo este prisma puede ex- 
presarse con leyes dinámicas que difieren de los ejemplos clásicos sólo 
en la naturaleza de las operaciones. Los ejemplos más importantes son 
el condicionamiento y la extinción (con sus procesos subsidiarios de 
discriminación), el impulso y la emoción, que propongo formular en 
términos de cambios en la fuerza del reflejo. A continuación, podemos 
describir un tipo de condicionamiento y su correspondiente extinción. 


LEY DE CONDICIONAMIENTO TIPO S. La presentación 
aproximadamente simultánea de dos estímulos, uno de los cuales (el 
estímulo “reforzante”) pertenece a un reflejo existente que en dicho 
momento posee cierta fuerza, puede producir un aumento en la fuerza 
de un tercer reflejo compuesto por la respuesta del reflejo reforzante 
y por el otro estímulo. 


LEY DE EXTINCIÓN TIPO S. Si el reflejo reforzado a través 
de un condicionamiento tipo S se provoca sin presentación del estímu- 
lo reforzante, su fuerza decrece. 

Estas leyes se refieren al tipo pavloviano de reflejo condicionado, 
que discutiré con detalle en el capítulo 3. Aquí deseo señalar simple- 
mente que los datos observados son meramente cambios en la fuerza 
de un reflejo. Como tales, no tienen dimensiones que los distingan de 
los cambios de fuerza que se producen durante la fatiga, la facilitación, 
la inhibición, o, como mostraré más tarde, de los cambios de impulso, 
emoción, etc. El proceso de condicionamiento se distingue por lo que 
se hace al organismo para inducir el cambio; en otras palabras, viene 
definido por la operación de la presentación simultánea del estímulo 
reforzante y otro estímulo. Este condicionamiento se llama tipo S 
para distinguirlo del condicionamiento tipo R (ver más adelante) en 
el que el estímulo reforzante es contingente a una respuesta. 

Antes de indicar que otras divisiones en el campo de la conducta 
pueden formularse en términos de la fuerza del reflejo, será necesario 
considerar otro tipo de conducta, que todavía no he mencionado. Las 
restantes leyes dinámicas se estudiarán en relación con ambos tipos 
a la vez. 
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La conducta operante 


Con el descubrimiento del estímulo y la catalogación de un gran 
número de relaciones específicas entre estímulos y respuestas, muchos 
autores llegaron a Suponer que toda la conducta se podría explicar de 
esta forma tan pronto como pudieran identificarse los estímulos apro- 
piados. Se han hecho muchas elaboradas tentativas para establecer la 
plausibilidad de este supuesto, pero, a mi juicio, éstas no se han reve- 
lado convincentes. Hay una gran parcela de la conducta que no pa- 
rece ser provocada, en el sentido en que una mota de polvo en el ojo 
provoca el cierre del párpado, aunque a fin de cuentas pueda poseer 
un tipo diferente de relación con los estímulos externos. La actividad 
original “espontánea” del organismo es principalmente de esta índole, 
así como la mayor parte de la conducta condicionada del organismo 
adulto, como espero mostrar más tarde. Afirmar simplemente que 
tienen que haber estímulos provocadores constituye una insatisfactoria 
apelación a la ignorancia. La esperanza más clara de establecer la ge- 
neralidad del estímulo provocador fue proporcionada por la demostra- 
ción de Pavlov de que parte de la conducta del organismo adulto se 
encontraba bajo el control de estímulos que habían adquirido su poder 
de provocación. Pero una formulación de este proceso mostrará que 
en todos estos casos la respuesta al estímulo condicionado debe ser 
primero provocada por un estímulo incondicionado. No creo que el 
“estímulo” que conduce a las elaboradas respuestas de cantar una can- 
ción o de pintar un cuadro pueda considerarse como el mero sustituto 
de un estímulo o un grupo de estímulos que originalmente provocaban 
esas respuestas o sus partes componentes. 

La mayor parte del apremio que ha caracterizado la búsqueda de 
estímulos provocadores deriva de un temor por la “espontaneidad” y 
su implicación de libertad. Cuando la espontaneidad no puede evitar- 
se, se trata de definirla en términos de estímulos desconocidos. Así, Bethe 
(28) dice que el término “se ha usado mucho tiempo para describir la 
conducta cuyos estímulos son desconocidos, y no veo ninguna razón 
por la que el término tenga que ser desterrado del vocabulario cientí- 
fico”. Sin embargo, puede ocurrir un acontecimiento sin ningún ante- 
cedente observado y ser tratado adecuadamente dentro del marco de 
una ciencia descriptiva. No quiero decir con ello que no existan fuer- 
zas que originen la conducta espontánea, sino simplemente que no se 
localizan en el ambiente. No estamos en condiciones de verlas, aunque, 
en realidad, tampoco tenemos necesidad de ello. Podemos decir que 
esta clase de conducta es emitida por el organismo, y disponemos de 
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técnicas apropiadas para tratarla en esa forma. Una variable indepen- 
diente importante es el tiempo. Al hacer uso de él reconozco simple- 
mente que el dato observado es la aparición de una muestra identifi- 
cable dada de conducta a un ritmo más o menos ordenado. El uso 
de la frecuencia de emisión es quizás la característica sobresaliente del 
método general que esbozaremos en las páginas siguientes, en las que 
vamos a extendernos ampliamente en conductas de este tipo. 

El intento de hacer encajar la conducta en la fórmula simple “es- 
tímulo-respuesta” ha retrasado la aparición del tratamiento adecuado 
para un amplio sector de conducta del que no es posible mostrar que 
se encuentra bajo el control de estímulos provocadores. En la pre- 
sente obra daremos mucha importancia al estudio de este campo sepa- 
rado. Las diferencias entre los dos tipos de conducta se irán acumu- 
lando a lo largo del libro, por lo que ahora no creo que valga la pena 
extenderme mucho sobre este punto. El tipo de conducta que está 
correlacionada con estímulos provccadores específicos puede llamar- 
se conducta respondiente y una correlación dada una respondiente. 
El sentido del término implica una relación con un acontecimiento 
anterior. A la conducta que no se halla bajo esta clase de control, la 


llamaré operante y a cualquier ejemplo científico una operante. El tér- / 


mino se refiere a un acontecimiento posterior, como vamos a señalar' 
en breve. El término reflejo será utilizado de forma que incluya tanto' 
a respondientes como a Operantes aun cuando en su significado origi- 
nal se aplicaba sólo a las respondientes. Un único término para ambos 


es conveniente porque los dos son unidades topográficas de conducta, 
y porque una operante puede adquirir, y generalmente lo hace, una 
relación con una estimulación previa. En general, la noción de reflejo 
debe vaciarse de toda connotación que suponga una “presión” activa 
del estímulo. Desde nuestro punto de vista, los términos se refieren a 
entidades correlacionadas, y a nada más. Todas las implicaciones de 
dinamismo y todas las definiciones metafóricas y figurativas deben, en 
la medida de lo posible, evitarse. 


Una operante es una parte identificable de la conducta de la que 


puede decirse, no que sea imposible hallar un estímulo que la provo- 
que (puede haber un respondiente cuya respuesta tenga la misma to- 
pografía), sino que, en las ocasiones en que se observa su ocurrencia, 
no puede detectarse ningún estímulo correlacionado. Se estudia como 
un acontecimiento que aparece espontáneamente con una frecuencia 
dada. No tiene leyes estáticas comparables a las de una respondiente, 
ya que, en ausencia de un estímulo, los conceptos de umbral, latencia, 
postdescarga y la razón R/S carecen de sentido. Por el contrario, se 
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Y 


debe recurrir a la frecuencia de ocurrencia con objeto de establecer 
la noción de fuerza. La fuerza de una operante es proporcional a su 
frecuencia de ocurrencia, y las leyes dinámicas describen los cambios 
en la tasa de ocurrencia que son producidos por las diversas operacio- 
nes ejecutadas sobre el organismo. 


Otras leyes dinámicas 


Tres de las operaciones ya descritas en relación con la conducta 
respondiente implican la provocación del reflejo y por ello son inapli- 
cables a las operantes, Son la fase refractaria, la fatiga y el condiciona- 
miento tipo S. La fase refractaria presenta un curioso paralelo en la 
misma tasa, como advertiré más tarde, y un fenómeno comparable con 
la fatiga puede también aparecer en una operante. El condicionamiento 
de una operante difiere del de una respondiente por implicar la corre- 
lación de un estímulo reforzante con una respuesta. Por esta razón, el 
proceso puede denominarse tipo R. Sus dos leyes son las siguientes : 


LEY DEL CONDICIONAMIENTO TIPO R. Si a la ocurrencia 
de una operante sigue la presentación de un estímulo reforzante, la 
fuerza aumenta. 


LEY DE LA EXTINCIÓN TIPO R. Si a la ocurrencia de una 
operante ya fortalecida por condicionamiento no sigue un estímulo re- 
forzante, la fuerza decrece. 

El condicionamiento es, en este caso, una vez más, una cuestión 
de cambio de fuerza. La fuerza no puede empezar a cero, puesto que 
al menos debe ocurrir una respuesta incondicionada para permitir el 
establecimiento de la relación con un estímulo reforzante. A diferencia 
del condicionamiento tipo S, el proceso tiene el efecto de determinar la 
forma de la respuesta, que es suministrada de antemano por las con- 
diciones de la correlación con un estímulo reforzante o por la forma 
en que la respuesta debe operar sobre el ambiente para producir un 
reforzamiento (ver capítulo 3). 

Sólo raras veces es posible definir una operante topográficamente 
(de manera que puedan contarse ejemplos sucesivos) sin la delineación 
más precisa de las propiedades que viene dada por el acto del condi- 
cionamiento. Esta dependencia con respecto al estímulo reforzante 
posterior da al término operante su significación. En una respondiente 
la respuesta es el resultado de algo hecho anteriormente al organismo. 
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Esto es cierto incluso para las respondientes condicionadas porque la 
operación de la presentación simultánea de dos estímulos precede, o 
al menos es independiente, a la ocurrencia de la respuesta, La operan- 
te, por otra parte, adquiere significación para la conducta y adopta 
una forma identificable cuando actúa sobre el ambiente de tal torma 
que se produzca un estímulo reforzante. La distinción entre operante 
y respondiente va más allá de la existencia entre los tipos S y R por- 
que se aplica asimismo a la conducta incondicionada; pero si ambos 
pueden aplicarse coinciden exactamente. El condicionamiento tipo R 
es imposible en una respondiente porque la correlación del estímulo 
reforzante con una respuesta implica una correlación con su estímulo 
provocador. Ya se ha señalado que el condicionamiento tipo S es im- 
posible en una Operante a causa de la ausencia de un estímulo pro- 
vocador. 

Una operante puede llegar a tener una relación con un estímulo 
que parece asemejarse con la relación entre el estímulo y la respuesta 
en una respondiente. El problema surge cuando la estimulación previa . 
se correlaciona con el reforzamiento de la operante. Puede decirse que 
el estímulo determina la ocasión en la que se reforzará una respuesta, 
y por consiguiente (mediante el establecimiento de una discriminación) 
en que ocurrirá, pero no provoca la respuesta. Volveremos más ade- 
lante sobre esta distinción. 


Una clase de operación que afecta a la fuerza de los reflejos (tanto 
operante como respondiente) cae dentro del campo tradicional del 
impulso o motivación. Sería ocioso pasar revista aquí a las diversas 
formas en que se ha formulado el campo (81). En una descripción de la 
conducta en términos del presente sistema el campo de estudio se pre- 
senta simplemente como una clase de cambios dinámicos de fuerza. 
Por ejemplo, supongamos que estamos observando un organismo en 
presencia de un pedazo de comida. Se suscitará cierta secuencia de 
reflejos progresivos, manipulativos e ingestivos. Los primeros estadios 
de esta secuencia son operantes, los últimos respondientes. En cualquier 
momento dado, las fuerzas pueden medirse ya sea observando la tasa 
de ocurrencia en el caso de los primeros, ya sea explorando las pro- 
piedades estáticas en el caso de los segundos. El problema del impulso 
surge porque los valores así obtenidos varían a lo largo de una amplia 
gama. En un momento dado, la cadena puede provocarse repetida- 
mente a una tasa elevada, mientras que en otro es posible que no se 
produzca ninguna respuesta durante un considerable período de tiem- 
po. En lenguaje corriente diríamos que el organismo come sólo cuando 
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está hambriento. Lo que en realidad observamos es que las fuerzas 
de esos reflejos varían, y debemos acometer la tarea de hallar las ope- 
raciones de las cuales son función. Eso no es difícil. Las más impor- 
tantes de todas son las operaciones de comer y ayunar. Permitiendo a 
un organismo hambriento, como una rata, comer pedazos de comida 
colocados ante él, es posible mostrar un descenso ordenado de la fuer- 
za de este grupo de reflejos. Al fin, se alcanza una fuerza muy baja y 
el acto de comer cesa. Permitiendo que transcurra cierto tiempo antes 
de poner de nuevo comida a su disposición, puede mostrarse que la 
fuerza ha aumentado hasta alcanzar un valor en el que se producirán 
respuestas. Lo mismo puede decirse de los últimos eslabones de la 
cadena, cuyas fuerzas (como respondientes) deben medirse en térmi- 
nos de las propiedades estáticas. Así, la cantidad de saliva segregada 
en respuesta a un estímulo gustativo puede estar asimismo en función 
de la comida y del ayuno. Manteniendo los otros factores constantes, 
se puede dar una explicación cabal de las fuerzas de este grupo particu- 
lar de reflejos en términos de esta operación. Sin embargo, hay otras 
operaciones a tener en cuenta que afectan a este mismo grupo como 
son la privación de agua, la enfermedad, etc. 


En otro importante grupo de cambios en la fuerza del reflejo la 
principal operación con la cual los cambios están correlacionados es 
la presentación de lo que podemos llamar estímulos “emocionales”, es- 
tímulos que provocan típicamente cambios de este tipo. Pueden ser 
incondicionados (por ejemplo, un shock eléctrico) o condicionados se- 
gún el tipo S en el que el estímulo reforzante ha sido emocional (por 
ejemplo, un tono que ha precedido a un shock). Otras operaciones que 
inducen un cambio emocional de fuerza son la represión de una res- 
puesta, la interrupción de una cadena de reflejos mediante la elimina- 
ción de un estímulo reforzante (ver más adelante), la administración de 
ciertas drogas, etc. El cambio de conducta resultante lo es, una vez 
más, en la fuerza de los reflejos, como mostraré con detalle en el ca- 
pítulo 11. 

Las operaciones que caracterizan el impulso y la emoción difieren 
de las otras enumeradas en que conllevan cambios concurrentes en 
grupos de reflejos. La operación de alimentar, por ejemplo, ocasiona 
cambios en todas las operantes que han sido reforzadas con comida y 
en todas las respondientes condicionadas e incondicionadas relaciona- 
das con la ingestión. Además, una sola operación no es única en sus 
efectos. Hay más de una forma de cambiar la fuerza del grupo de re- 
flejos que varían con la ingestión o con un estímulo emocional. Además 
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de la formulación del efecto sobre un solo reflejo, también debemos 
tratar el impulso o la emoción como el “estado” de un grupo de re- 
ilejos. Esto se logra introduciendo un término medio hipotético entre 
la operación y el cambio resultante observado. “Hambre”, “temor” y 
otros son términos de este tipo. Se dice que la operación de alimentar 
afecta al hambre, y el hambre a su vez a la fuerza del reflejo. La 
noción de un estado intermedio es valiosa cuando: a) más de un refle- 
jo es afectado por la operación, y b) cuando varias operaciones tienen 
el mismo efecto. Su utilidad puede tal vez clarificarse con los esquemas 
siguientes. Cuando una operación es única en su efecto y se aplica 
a un solo reflejo, puede representarse de la manera siguiente : 


Operación 1 —— (  ) ———- Fuerza del reflejo 1, 


en que no se necesita ningún término medio. Cuando hay varias opera- 
ciones que tienen el mismo efecto y que afectan a varios reflejos, la 
relación puede representarse como sigue: 


Operación I =— _-— Fuerza del reflejo 1 
Operación 11 ————.——“Estado” Fuerza del reflejo 1 
Operación NI 7 “— Fuerza del reflejo 1 


En el presente sistema los términos intermedios hipotéticos (“es- 
tados”) serán usados en los casos de impulso y emoción, pero no se 
les asignarán otras propiedades. Una ley dinámica siempre se refiere 
al cambio de fuerza de un solo reflejo en función de una sola opera- 
ción, y el término intermedio es realmente innecesario en su expresión. 


La observación del estado de un reflejo en cualquier momento dado 
se limita a su fuerza. Como quiera que los datos son cambios de fuer- 
za y por tanto los mismos en todas las leyes dinámicas, el sistema re- 
Salta la gran importancia de la definición y clasificación de opera- 
ciones. La simple fuerza del reflejo constituye por sí misma un hecho 
ambiguo. Es imposible decir, partiendo de una observación momentá- 
nea de fuerza, si su valor es debido especialmente a una operación de 
impulso, condicionamiento o emoción. Supongamos, por ejemplo, que 
hemos estado trabajando con una operante que ha sido reforzada 
con comida y que, en un momento dado, observamos que el organismo 
no responde (es decir, que la fuerza es baja). A partir del estado del 
reflejo considerado aisladamente, es imposible distinguir entre los ca- 
sos siguientes: 1) El organismo está hambriento y no tiene miedo, pero 
la respuesta se ha extinguido. 2) La respuesta está condicionada, y el 
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organismo está hambriento, pero temeroso. 3) La respuesta está con- 
dicionada, y el organismo no está temeroso ni tampoco hambriento. 
4) La respuesta está condicionada, pero el organismo está a la vez no 
hambriento y temeroso. 5) El organismo está hambriento, pero tiene 
miedo, y la respuesta se ha extinguido. 6) El organismo no tiene miedo, 
pero no está hambriento y la respuesta se ha extinguido. 7) La res- 
puesta se ha extinguido, y el organismo tiene miedo, pero no está ham- 
briento. Podemos decidir entre estas posibilidades haciendo referencia 
a otra conducta. Si presentamos el estímulo de un reflejo incondicio- 
nado que varíe con el hambre y el temor (es decir, si presentamos ali- 
mento), la cuestión del condicionamiento queda eliminada. Si el orga- 
nismo come, el primer caso enumerado más arriba se cumple. Si no 
come, las posibilidades son las siguientes: 1) El organismo está ham- 
briento, pero temeroso. 2) No está temeroso pero tampoco hambriento. 
3) Está a la vez no hambriento y temeroso. Si luego comprobamos otro 
reflejo, cuya fuerza decrezca en un estado de temor pero que no varíe 
con el hambre, y lo hallamos fuerte, el organismo no está temeroso y 
por tanto no debe estar hambriento. 

La fuerza de un reflejo en cualquier momento dado está en función 
de todas las operaciones que lo afectan. La tarea principal de una 
ciencia de la conducta consiste en aislar sus efectos separados y en 
establecer sus relaciones funcionales con la fuerza del reflejo. 


El desarrollo de leyes dinámicas nos permite considerar incluso 
como reflejo (es decir, como sometida a leyes) la conducta que inva- 
riablemente no ocurre bajo un conjunto determinado de circunstancias. 
Los primeros ejemplos clásicos del reflejo eran aquellos cuyo someti- 
miento a leyes era evidente. Su evidencia era debida a que el número 
de variables implicadas era limitado. Un reflejo de flexión podía des- 
cribirse muy pronto porque estaba controlado por un estímulo y no 
estaba, en gran medida, en función de las operaciones de impulso, 
emoción o condicionamiento, que ocasionan la mayor variabilidad en 
la fuerza. El descubrimiento del condicionamiento tipo S colocó bajo 
el principio del reflejo una serie de actividades cuyo sometimiento a 
leyes no fue evidente hasta que la operación de condicionamiento fue 
controlada. Las operantes, en tanto que entidades predictibles, no son 
aisladas naturalmente hasta el final porque no están controladas me- 
diante estímulos y están sujetas a muchas operaciones. No están ob- 
viamente sometidas a leyes. Pero con un control riguroso de todas las 
Operaciones relevantes se observa que el tipo de necesidad que, natu- 
ralmente, caracteriza a los reflejos simples se aplica a la conducta en 
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general. Presento el material experimental descrito en este libro en 
apoyo de esta tesis. 


La reserva del reflejo 


Ya hemos notado que un tipo de operación (por ejemplo, el invo- 
lucrado en la fatiga y el condicionamiento) es único en su efecto y 
cambia la fuerza de un solo reflejo, mientras que otro tipo (por ejem- 
plo, el del impulso o la emoción) tiene un efecto que es común a todas 
las operaciones y que afecta a un grupo de reflejos. En el último caso 
la noción de término intermedio (como un “estado” del impulso o la 
emoción) es conveniente, pero en el primero sugerimos una concepción 
diferente. Una operación que afecta a la fuerza de un solo reflejo siem- 
pre entraña provocación. En la fatiga del reflejo, por ejemplo, la fuerza 
está en función de la provocación repetida. Y esta relación entre la 
fuerza y la provocación previa es tal que podemos hablar de una cierta 
cantidad de actividad disponible, que se agota durante el proceso de 
provocación repetida y en función de la cual está en todo momento 
la fuerza del reflejo. 

Designaré a la actividad disponible total como reserva del reflejo, 
un concepto que ocupará un importante lugar en los capítulos siguien- 
tes. En cierto sentido la reserva es una entidad hipotética. Es una 
forma conveniente de representar la relación particular que prevalece 
entre la actividad de un reflejo y su fuerza subsiguiente. Pero más 
tarde mostraré con detalle que aparece claramente una reserva con 
todas sus propiedades relevantes durante el proceso que la agota, y 
que la fuerza momentánea es proporcional a la reserva, siendo por esta 
razón una medida directa disponible. Por consiguiente, la reserva pue- 
de casi ser tratada experimentalmente de forma directa, aunque no 
tenga asignadas propiedades locales o fisiológicas. La noción se aplica 
a todas las operaciones que implican la provocación del reflejo y tanto 
a la conducta operante como respondiente, condicionada o incondi- 
cionada. 

Una distinción entre un reflejo incondicionado y condicionado es 
que la reserva del primero está siendo restaurada constantemente de 
forma espontánea, cuando no está ya al máximo. En el caso particular 
de la fatiga del reflejo, es evidente un flujo espontáneo hacia la re- 
serva en el restablecimiento completo de la fatiga que tiene lugar du- 
rante el descanso y en la posibilidad de alcanzar un estado intermedio 
estable cuando la tasa de restauración casi iguala la tasa de agotamien- 
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to a una determinada frecuencia de provocación. En muchos reflejos 
incondicionados la reserva es muy grande y es reemplazada a una tasa 
tan alta que el agotamiento resulta difícil. Por otra parte, la reserva 
puede ser muy baja y lentamente restaurada, como en la respuesta de 
sobresaltarse ante un sonido, que puede ocurrir una o dos veces a la 
primera presentación, pero requerir un período muy largo de inactivi- 
dad para recobrar su fuerza (el fenómeno de la “adaptación”). En los 
reflejos condicionados la reserva se elabora por el acto del reforzamien- 
to, y la extinción constituye esencialmente un proceso de agotamiento 
comparable a la fatiga. La concepción se aplica a ambos tipos de con- 
dicionamiento y conduce a una formulación del proceso mucho más 
comprensiva de la que puede obtenerse en términos de mero cambio 
de fuerza. La relación de la reserva con las operaciones de reforza- 
miento y extinción será tratada con detalle en los capítulos 3 y 4. 

Dado que la fuerza de un reflejo es proporcional a su reserva, pue- 
de ser alterada de dos modos. O bien se puede cambiar el volumen de 
la reserva o bien la proporcionalidad entre ella y la fuerza. "Todas las 
operaciones que entrañan provocación afectan a la reserva directa- 
mente, ya sea para aumentarla o para disminuirla. El condicionamiento 
la incrementa; la extinción y la fatiga la reducen. Las otras operacio- 
nes (que no son únicas en su acción y afectan a grupos de reflejos) 
cambian la proporcionalidad entre la reserva y la fuerza. La facilita- 
ción y ciertos tipos de emoción acrecientan la fuerza, mientras que 
la inhibición y otros tipos de emoción la reducen sin modificar la re- 
serva. Las operaciones que controlan el impulso asimismo afectan al 
factor de la proporcionalidad. Sin alterar el número total de respuestas 
disponibles, un cambio de impulso puede cambiar la tasa de provoca- 
ción de una operante de un valor mínimo a un valor máximo. Varias 
demostraciones de la distinción entre alterar la reserva y alterar la 
proporcionalidad aparecerán más tarde. 

Es una respondiente fásica la fase refractaria sugiere una reserva 
subsidiaria más pequeña que se agota completamente o casi completa- 
mente en cada provocación. Esta reserva subsidiaria se restaura a par- 
tir de la reserva total, pero la tasa de restauración depende del volu- 
men de esta última. Así, durante la fatiga de dicha respondiente, la 
fase refractaria se prolonga progresivamente. La tasa de provocación 
de una operante presenta un efecto similar, como ya he advertido. La 
reserva total de una operante no se consume enseguida en cuanto sur- 
ge la oportunidad; la tasa de provocación es relativamente lenta y al 
parecer depende de una reserva subsidiaria similar agotada en cada 
ocurrencia individual. Podemos considerar que tendrá lugar la emisión 
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de una respuesta operante cuando la reserva subsidiaria alcance un 
valor crítico, Una segunda respuesta no puede ocurrir hasta que la 
reserva subsidiaria haya recuperado el mismo valor. La tasa de restaura- 
ción está una vez más en función de la reserva total. No voy a referir- 
me en lo sucesivo a la reserva subsidiaria. Es relativamente poco im- 
portante en el caso de la conducta respondiente, porque sólo unas 
pocas respondientes son fásicas. En la conducta operante la noción de 
tasa la engloba de forma adecuada. 

La noción de reserva y la de proporcionalidad variante entre ella 
y la fuerza es algo más que una mera definición de las propiedades 
dinámicas en términos de la fuerza del reflejo. Una forma conveniente 
de reunir tales hechos es la siguiente (ejemplos apropiados aparecerán 
más tarde): existe una relación entre el número de respuestas que apa- 
recen durante la extinción de una operante y el número de reforzamien- 
tos precedentes (es decir, el número de respuestas que puede obte- 
nerse del organismo se encuentra estrictamente limitado por el número 
que se ha puesto en él); los cambios de impulso no alteran el mú- 
mero total de respuestas disponibles, aunque la tasa de respuesta pueda 
variar grandemente; los cambios emocionales, facilitativos e inhibito- 
rios son compensados por cambios posteriores de fuerza, etc. 


La interacción de los reflejos 


La reducción real del número de variables que afectan a un sistema 
orgánico (como la que se consigue apagando las luces de una habita- 
ción) debe distinguirse de una reducción hipotética en que la constan- 
cia o irrrelevancia de una variable simplemente se da por supuesta. En 
el último caso, la unidad analítica resultante no puede siempre demos- 
trarse de hecho y el análisis puede considerarse como completo sólo 
cuando a través de una síntesis se ha producido un retorno efectivo al 
sistema no analizado original, Ahora bien, el tipo de variable represen- 
tada por el estímulo puede controlarse e incluso en algunos casos eli- 
minarse. Muchas de nuestras técnicas de análisis están consagradas a 
este fin. El reflejo como unidad de análisis es en realidad obtenido 
en la práctica. La unidad es un hecho, y su validez y la validez 
de las leyes que describen sus cambios no depende de la exactitud de 
las suposiciones analíticas o de la posibilidad de una síntesis ulterior 
que abarque conducta más compleja. 

Las leyes precedentes se han aplicado, de esta forma práctica, a una 
sola unidad aislada. Son válidas en la medida en que se cumplen, pres- 
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cindiendo del destino de la unidad cuando se permite la entrada de 
otros estímulos. No nos vemos en la obligación de validar la unidad 
mediante algún tipo de síntesis. Pero una descripción de la conducta 
sería inadecuada si no fuera capaz de dar una explicación de la exis- 
tencia de las unidades separadas y de su funcionamiento conjunto en 
la conducta ordinaria del organismo. Además de los procesos que afec- 
tan a la fuerza del reflejo, una descripción de la conducta debe tener 
en cuenta la interacción de sus partes funcionales separadas. La inter- 
acción puede estudiarse de forma práctica combinando deliberada- 
mente elementos previamente aislados y observando sus efectos mu- 
tuos. De esta forma obtenemos una serie de leyes que nos permiten 
enfrentarnos con aquellas muestras de conducta más amplias, a veces 
incierta si no erróneamente designadas como “totalidades”. El gran 
pseudoproblema —¿Es el todo mayor que la suma de sus partesp— 
adquiere en el caso presente esta forma inteligible: ¿Qué sucede cuan- 
do los reflejos interactúan? Los efectos de la interacción son en parte 
topográficos y en parte intensivos. 


LEY DE LA COMPATIBILIDAD. Dos o más respuestas que no se 
superponen topográficamente pueden ocurrir simultáneamente sin in- 
terferencia. Las respuestas pueden hallarse bajo el control de estímulos 
separados (como cuando se golpea el tendón rotular y al mismo tiem- 
po se manda un destello de luz a los ojos, de tal manera que la sacu- 
dida de la rodilla y la contracción de la pupila ocurran simultáneamen- 
te) o de un solo estímulo (como cuando un shock ejercido sobre la 
mano provoca la flexión del brazo, vasoconstricción, cambios respira- 
torios, etc.). Parece que la ley se cumple sin excepción en lo que con- 
cierne a las respondientes, pero que requiere una cierta cualificación en 
otros casos. No podemos combinar operantes de forma tan deliberada 
porque no podemos provocarlas. Solamente podemos presentar estímu- 
los discriminativos simultáneamente y generar impulsos apropiados. 
Cuando los estímulos discriminativos apropiados son pocos, de forma 
que se evita la superposición topográfica de los estímulos, y cuando 
el impulso es fuerte, puede no haber interferencia hasta el límite esta- 
blecido por la topografía de las respuestas. Así, un operario puede pa- 
rar su torno accionando el embrague con el pie, reducir la marcha 
del mandril con una mano, aflojar el cabezal móvil con la otra mano, 
volver su cabeza para que la luz dé sobre una cierta parte de su obra 
y llamar a su ayudante, todo al mismo tiempo. Pero esto sólo ocurrirá 
si el impulso es fuerte, o sea, si el operario está trabajando rápidamen- 
te. Por lo general, las respuestas se suceden unas a otras y ocurren en 
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una especie de orden serial, aun cuando la superposición topográfica 
sea escasa o nula. 


LEY DE LA PREPOTENCIA. Cuando dos reflejos se superponen 
topográficamente y las respuestas son incompatibles, puede ocurrir 
una respuesta si existe exclusión de la otra. La noción de prepotencia 
ha sido investigada ampliamente por Sherrington (68). El efecto no es la 
inhibición tal como la hemos definido más arriba porque ambos es- 
tímulos controlan al mismo efector, Diversas teorías de la inhibición 
han recurrido a la prepotencia —a la actividad competitiva de respues- 
tas incompatibles— como principio explicativo, pero con la limitada 
definición aquí adoptada los dos procesos son claramente distintos? La 
prepotencia se aplica tanto a la conducta operante como respondiente, 
pero, como en el caso de la ley de la compatibilidad, no se demuestra 
fácilmente con operantes porque el momento preciso de la provocación 
no es controlado. 


LEY DE LA SUMACIÓN ALGEBRAICA. La provocación simul- 
tánea de dos respuestas que utilicen los mismos efectores, pero en di- 
reacciones contrarias, produce una respuesta cuya magnitud es una 
resultante algebraica. Si un reflejo es mucho más fuerte, puede que 
se observe una huella escasa o nula del reflejo más débil, y el caso se 
asemeja al de la prepotencia. Cuando los dos se equilibran exactamen- 
te, o bien no se observa ninguna respuesta, o bien, como sucede a me- 
nudo en sistemas de este tipo, aparece una oscilación de mayor o menor 
amplitud. Cuando las fuerzas difieren ligeramente ocurre una res- 
puesta parcial o más lenta en la dirección del más fuerte. Un ejemplo 
familiar es la conducta operante de una ardilla al acercarse a un 
nuevo objeto. Hay dos respuestas: una hacia el objeto, y la otra de re- 
tirada respecto del objeto. Si una u otra son relativamente fuertes, la 
conducta resultante es, simplemente, el acercamiento o la retirada. Si 
el acercamiento es fuerte, pero la retirada no es negligible, tiene lugar 
un acercamiento lento. Cuando las dos se equilibran (como sucede a 
menudo en algún punto del acercamiento), puede observarse una rá- 
pida oscilación. Un ejemplo respondiente, que ha sido demostrado por 
Magnus (61), es la posición del ojo del conejo durante los cambios de pos- 
tura, que se debe a la sumación algebraica de los reflejos de los labe- 
rintos y de los receptores de los músculos del cuello. Cuando una 
respuesta se ve plenamente anulada, el efecto debe distinguirse de la 


3. Para una exposición reciente de la inhibición como prepotencia, ver (77). 
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inhibición, como en el caso de la prepotencia, ya que ambos estímulos 
controlan al efector. 


LEY DE LA MEZCLA. Dos respuestas que presenten cierta su- 
perposición topográfica pueden provocarse conjuntamente pero en for- 
mas necesariamente modificadas. Al tocar el piano manteniendo en 
equilibrio un vaso de vino sobre el dorso de la mano, los movimientos 
usuales de los dedos son modificados por la conducta de equilibrio. El 
resultado es una interacción mecánica de la musculatura y se parece 
a la mvodificación externa de una respuesta como cuando uno toca con 
una pesa atada a la mano. En el primer caso, la forma usual de la 
conducta es modificada por otros reflejos; en el segundo, por una fuerza 
externa. La mayor parte de la conducta normal de un organismo pre- 
senta una mezcla de este tipo. Magnus (61) nos brinda muchos ejem- 
plos respondientes. 


LEY DE LA SUMACIÓN ESPACIAL. Cuando dos reflejos tienen 
la misma forma de respuesta, la respuesta a ambos estímulos combina- 
dos tiene una mayor magnitud y una latencia más corta. La sumación 
espacial difiere de la sumación temporal por cuanto plantea un pro- 
blema topográfico. Un reflejo se define tanto en térmisos de estímulo 
como de respuesta. Dos estímulos definen reflejos separados aun cuan- 
do la respuesta sea la misma. En la sumación espacial estamos tratando 
más la interacción de los reflejos que de la intensificación del estímulo 
de un solo reflejo como en la sumación temporal. Esto es obvio cuan- 
do los estímulos están localizados en forma distante o en campos sen- 
soriales separados. Puede demostrarse fácilmente un ejemplo familiar 
en los niños. Un movimiento de la mano ante los ojos y un ligero so- 
nido, ninguno de los cuales evocaría un parpadeo presentado solo, 
pueden ser efectivos en combinación. Como sucede con frecuencia en 
los casos de sumación, el ejemplo se aplica a los valores de umbral; 
pero cuando los estímulos son lo bastante fuertes para evocar la res- 
puesta separadamente, el efecto de su combinación puede reflejarse 
presumiblemente en la magnitud de la respuesta. Cuando los estímu- 
los se hallan en el mismo campo sensorial, y especialmente cuando son 
casi adyacentes, esta formulación en términos de interacción puede 
parecer atrasada, pero, a mi juicio, está en armonía con los datos rea- 
les y viene exigida por el presente sistema. La observación fundamen- 
tal es que la respuesta al estímulo combinado es más fuerte que la 
respuesta a cada uno de los dos estímulos considerados separadamen- 
te. El resultado debiera incluirse bajo la sumación algebraica, tomada 
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literalmente, pero generalmente se establece una clase separada para 
el caso en que las respuestas no sólo implican a los mismos efectores, 
sino que los utilizan en la misma dirección. Gran parte de la conducta 
de un organismo está bajo el control de más de un estímulo operando 
sinérgicamente. Podemos hallar excelentes ejemplos en la obra de 
Magnus sobre el control de la postura (61, 62). 

Debemos señalar una distinción entre la sumación espacial y la 
facilitación, En la facilitación la fuerza del reflejo cambia con arreglo 
a una ley dinámica, cuando la operación definitoria consiste en la pre- 
sentación de un estímulo. La relación existente entre el estímulo y el 
cambio de fuerza es como la de la inhibición si exceptuamos la direc- 
ción del cambio. La única condición que distingue la facilitación de la 
sumación es que el estímulo facilitante por sí solo no debe ser capaz 
'de provocar la respuesta. Si no se mantuviera «esta lWistinción, los dos 
fenómenos se confundirían. En la sumación no podemos considerar que 
un estímulo incremente la fuerza ide la relación entre el segundo y la 
respuesta a causa del efecto directo observado sobre la respuesta del 
primero. En la facilitación, al faltar este efecto, debemos formular el 
cambio como un ejemplo de ley dinámica. La facilitación implica un 
reflejo y un estímulo, pero la sumación implica dos reflejos. 


Otras dos leyes que entran en el amplio apartado de la interacción 
tienen un estatuto ligeramente diferente, pero podemos incluirlas ahora. 


LEY DEL ENCADENAMIENTO. La respuesta de un reflejo pue- 
de constituir o producir el estímulo provocador o discriminativo de otro. 
Los estímulos pueden ser propioceptivos (como en la reacción serial 
de lanzar una pelota) o producidos externamente ¡por un cambio de 
posición de los receptores (como en el caso del organismo que mira 
hacia la derecha y luego responde a un estímulo visual resultante, o 
alarga la mano y luego coge el objeto que toca). La ley del encadena- 
miento será considerada con más detalle en el capítulo siguiente. 


LEY DE LA INDUCCIÓN. Un cambio dinámico en la fuerza de 
un reflejo puede ir acompañado por un cambio similar, pero no tan 
amplio en un reflejo relacionado con él, consistiendo esta relación en 
la posesión de propiedades comunes de estímulo o respuesta. Los cam- 
bios dinámicos se limitan a aquellos que afectan a la reserva. Un 
ejemplo de inducción lo constituye la fatiga de un reflejo de flexión 
en un punto de estimulación a través de la repetida provocación de 
un reflejo en otro punto. Éste no 'es el significado dado a la inducción 
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por Sherrigton y Pavlov. Tal como lo usa Sherrington, el término se 
refiere tanto a la sumación de estímulos adyacentes (inducción inme- 
diata) como el fortalecimiento “postinhibitorio” de un reflejo relacio- 
nado (inducción sucesiva). Esta última forma, como indica Sherrington, 
constituye en varios aspectos el reverso de la primera, y el uso de un 
solo término para ambas puede inducir a error. Pavlov adopta el tér- 
mino a partir ide Sherrington, pero sólo lo usa en el segundo sentido. 
Ninguno de los dos casos se ajusta a la presente definición, por lo que 
será conveniente consultar el capítulo 5 en el que se procede a una 
explicación más completa de la misma. 


La naturaleza genérica de los conceptos de estímulo y respuesta 


El sistema precedente se basa en el supuesto de que tanto la 
conducta como el ambiente pueden descomponerse en partes que con- 
serven su identidad a lo largo de un experimento y que sufran cambios 
ordenados. Si este supuesto no se encontrara hasta cierto punto justi- 
ficado, una ciencia de la conducta sería imposible. Pero el análisis 
de la conducta no es un acto de subdivisión arbitraria. No podemos 
definir los conceptos de estímulo y respuesta simplemente como “partes 
de la conducta y del ambiente” sin tomar en consideración las líneas 
naturales de ruptura a través de las cuales se produce realmente la 
separación “de la conducta y del ambiente. 

Si pudiéramos limitarnos a la provocación de un reflejo en una sola 
ocasión, el problema no se plantearía. La descripción completa de un 
acontecimiento tan sólo comportaría dificultades técnicas; y si no se 
impusiera ningún límite sobre el instrumental, en la mayoría de los 
casos se podría dar una explicación adecuada de lo que puede con- 
ceptuarse como estímulo y como respuesta. Debemos dar respuesta 
a la pregunta de qué estamos describiendo. Pero se requiere una uni- 
dad reproducible con objeto ide predecir la conducta, y una explica- 
ción de una sola provocación, por perfecta que sea, 'es inadecuada para 
este propósito. Es muy difícil hallar un estímulo y una respuesta que 
mantengan precisamente las mismas propiedades topográficas en dos 
ocasiones sucesivas. La unidad identificable es algo más o algo menos 
que dicha entidad completamente descrita. 

En el campo tradicional de la fisiología del reflejo este problema 
se trata forzando las condiciones. La 'investigación se confina a un 
reflejo en el que la respuesta es originalmente de una especie muy sim- 
ple o puede simplificarse fácilmente (por ejemplo, la flexión o la 
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salivación) y en el que el estímulo es de una forma conveniente y pue- 
de localizarse precisamente. Es más fácil restringir el estímulo que la 
respuesta, ya que el estímulo se presenta como la variable indepen- 
diente, pero es posible controlar también algunas de las propiedades 
de la respuesta mediante medios quirúrgicos u otros medios técnicos. 
De esta forma se llega a conseguir una especie de reproductibilidad, y 
se obtiene frecuentemente una preparación restringida en la que se 
correlaciona un estímulo con una respuesta y todas las propiedades 
de ambos términos son capaces de especificación dentro de una gama 
muy limitada. En muchos casos, una preparación de este tipo puede 
constituir una solución adecuada al problema de la reproductibilidad. 
Probablemente siempre se requiere cierto grado de restricción para 
que pueda llevarse a cabo con éxito una experimentación. Pero hay 
que rechazar un elevado grado de restricción como solución general, 
puesto que implica un elemento arbitrario, cuyo carácter exacto de- 
pende de la selección de las propiedades y no corresponde plenamente 
al material originalmente objeto de investigación. El mismo acto de 
la restricción suprime una importante característica del reflejo típico, 
y, por lo demás, no es una solución práctica que puede extenderse a 
la totalidad de la conducta. 

Un ejemplo ide este ¡problema podría ser el siguiente. En el rela- 
tivamente simple, reflejo de flexión, la localización exacta del estímu- 
lo es poco importante; puede demostrarse una respuesta correlacio- 
nada aun cuando el estímulo se aplique en otra parte, dentro de 
mágenes bastante amplios. La forma de energía tampoco tiene que ser 
específica. De forma similar, desde el punto de vista de la respuesta 
no podemos especificar la dirección exacta de la flexión si no hemos 
simplificado o, habiendo simplificado, no podemos justificar la selec- 
ción de una dirección en vez de la otra. Por consiguiente, en lo que 
concierne a la mera provocación del reflejo, la mayor parte de las 
propiedades de los dos acontecimientos en correlación son irrelevan- 
tes. Las únicas propiedades relevantes son la flexión (la reducción del 
ángulo hecha por segmentos adyacentes de un miembro en una articu- 
lación dada) y un tipo de estimulación (“nociva”) determinada apli- 
cada dentro de un área más bien amplia. Veremos, pues, que al enun- 
ciar el reflejo de flexión como una unidad el término “estímulo” debe 
referirse a una clase de acontecimientos, cuyos miembros posean cier- 
tas propiedades en común, pero que por lo demás difieran de forma 
bastante libre, y el término “respuesta” a una clase similar que mues- 
tre una mayor libertad de variación, pero también definida rigurosa- 
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mente won respecto a una o más propiedades. La correlación que lla- 
mamos reflejo es una correlación de clases y el problema del análisis 
es el problema de encontrar las propiedades definitorias correctas. 
El nivel de análisis en el que aparecen clases significativas no es 
determinable a partir de la simple demostración de una correlación 
del estímulo y la respuesta, sino que debe llegarse a él a través del 
estudio de las propiedades dinámicas de la unidad resultante. Ello 
es obvio en el caso de la operante, ya que la correlación con el estímu- 
lo no existe, peno asimismo se cumple en el caso de la conducta res- 
pondiente. Para mostrar esto será preciso repasar el procedimiento por 
el que se establece un reflejo. El primer paso hacia lo que se llama el 
descubrimiento de un reflejo es la observación de algún aspecto de 
la corducta que ocurre repetidamente bajo una estimulación general. 
El control sobre la respuesta es casi exclusivamente el de la especifi- 
cación. Rechazamos todas las respuestas que no responden a los cri- 
terios que hemos seleccionado. Cuando la propiedad definitoria de 
una clase ha sido decidida, los estímulos que provocan las respuestas 
que la poseen se descubren mediante la exploración. Un estímulo 
puede ser suficiente para demostrar la clase de correlación que bus- 
camos, pero ya sea deliberadamente o ya sea por falta de control 
se varían generalmente las propiedades en posteriores provocaciones 
y así se añaden a ella otros miembros de la clase de estímulo. Poste- 
riormente, se identifica la propiedad definitoria del estímulo como la 
parte común de los diferentes estímulos que resultan ser efectivos. 
Debemos disponer de propiedades definitorias tanto en el lado del 
estímulo como de la respuesta o las clases no tendrían ninguna refe- 
rencia necesaria a aspectos reales de conducta. Si se permite definir 
el reflejo de flexión simplemente como un reflejo que tiene como 
respuesta una clase definida por la flexión, no hay nada que pueda 
impedir la definición de un número infinito de reflejos sobre bases 
similares. Por ejemplo, podríamos decir que hay un reflejo o clase de 
reflejos definidos por esta propiedad: que en la provocación el centro 
de gravedad de un organismo se desplaza hacia el norte. Esta clase 
es inútil desde el punto de vista experimental, puesto que trata de 
reunir actividades con escasa relación, pero debemos estar dispuestos 
a mostrar que todas las flexiones están relacionadas de una forma en 
que no lo están todos los movimientos geográficos del centro de gra- 
vedad, y para ello debemos recurrir al hecho observado de que todas 
las flexiones son provocables mediante estímulos de unas pocas clases. 
Tan pronto como esta relación es evidente, nuestra clase de respuesta 
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provisional empieza a adquirir realidad experimental como una carac- 
terística de la conducta del organismo.* 

Como quiera que somos completamente libres en esta primera elec- 
ción, es fácil que seleccionemos una propiedad incorrecta, pero mues- 
tro error pronto se hará patente al ser incapaces de mostrar su corre- 
lación con una sola clase de estímulo. Sin embargo, sigue habiendo 
una cierta libertad en la especificación de la respuesta. Al incluir otras 
propiedades en nuestra especificación, podemos establecer clases más 
restringidas, para las cuales podemos hallar correlativamente clases de 
estímulos asimismo más restringidos. Por ejemplo, si empezamos con 
“una flexión sólo en una dirección específica”, obtenemos una clase 
de estímulo que abarca una área de estimulación más reducida. No 
hay nada que pueda impedir tomar esta unidad restringida desde el 
principio, en tanto que pueda hallarse una clase de estímulo para 
dicha clase de respuesta, y si tomamos primero una unidad restrin- 
gida podemos llegar al término más amplio haciendo desaparecer las 
restricciones. 

Con la clase dada por una primera propiedad definitoria, pues, po- 
demos establecer subclases mediante la restricción arbitraria de las 
otras propiedades. Este procedimiento produce una serie de respues- 
tas, generadas por la restricción progresiva, cada miembro de la cual 
posee un estímulo correspondiente en una serie más o menos paralela. 
Nos acercamos como límite a la correlación de una respuesta completa- 
mente especificada y un estímulo que no es necesariamente estricta- 
mente constante, pero que puede mantenerse así experimentalmente. 
En este estadio la unidad no es práctica y «carece de plena represen- 
tatividad. 

Generalmente, las primeras restricciones están destinadas a pro- 
teger la propiedad definitoria excluyendo los casos extremos. Clarifi- 
can la definición y añaden peso a la expresada correlación con una 
clase de estímulo. En general, a medida que incrementamos nuestras 
restricciones, el término descriptivo asignado al reflejo llega a incluir, 
cada vez más, una parte mayor de los dos acontecimientos y, por 
consiguiente, es tanto más útil. Al propio tiempo, se exige una restricción 
cada vez mayor de la clase de estímulo, de tal forma que el aumento 
de validez y globalidad de la correlación debe ser satisfecha con un 
esfuerzo experimental adicional. 

Si ahora examinamos las propiedades dinámicas de esta serie de 
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4. La imposibilidad de definir un estimulo funcional sin referencia a una 
respuesta funcional y viceversa ha sido destacada especialmente por Kantor (53). 
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correlaciones, encontramos que con una progresiva restricción los cam- 
bios dinámicos de fuerza se hacen cada vez más regulares. Los cambios 
en cuestión son los que afectan a la reserva, no a la proporcionalidad 
de la reserva y la fuerza. Si estamos midiendo fatiga, por ejemplo, no 
obtendremos una curva demasiado suave si nuestro estímulo varía de 
tal forma que produzca en un momento dado una dirección de la 
flexión y, en otro momento, otra; pero a medida que restringimos el 
estímulo obtenemos una respuesta menos variable, y la suavidad de 
la curva aumenta. Esencialmente, ello es una consecuencia de la ley 
de la inducción. En un proceso como la fatiga o la extinción exami- 
namos el efecto de tuna provocación sobre otra que la sigue. Buscamos 
este efecto para seguir la regla principal ide la inducción; ésta será 
función del grado de comunidad de las propiedades. Por consiguien- 
te, en una preparación completamente restringida deberíamos tener 
una especie de inducción completa, puesto que las dos provocaciones 
sucesivas serían idénticas. Cada provocación surtiría su efecto pleno, 
y la curva del cambio dinámica sería suave. Pero si usamos solamente 
una entidad parcialmente restringida, las provocaciones sucesivas no 
tienen por qué tener idénticamente las mismas propiedades, y los 
procesos dinámicos pueden ser o no etapas plenas avanzadas. Todo 
cambio que hace que las provocaciones sucesivas se asemejen con más 
probabilidad unas a otras se traduce en una mejora de los datos. 

La naturaleza genérica de los conceptos de estímulo y respuesta 
viene demostrada por «el hecho de que la inducción completa se obtie- 
ne (y por lo tanto los cambios dinámicos alcanzan una uniformidad 
óptima) antes de que todas las propiedades del estímulo o la respuesta 
hayan sido plenamente especificadas en la descripción y respetadas 
en cada provocación. No estoy en condiciones a demostrar este hecho 
en el caso de la coriducta respondiente porque el presente grado de 
regularidad de los cambios dinámicos es inadecuado, pero en la con- 
ducta operante la imisma argumentación «es válida. En el caso de la 
conducta operante, «el recurso a leyes dinámicas es especialmente sig- 
nificativo porque falta el otro tipo de operación que establece las 
propiedades de una clase (la presentación de un estímulo). A un nivel 
cualitativo la definición de una operante depende de la repetición de 
una muestra de conducta con mayor o menor uniformidad. Antes 
de quodamos ver precisamente en qué consiste un acto dado, de- 
bemos examinar los cambios que experimenta en su fuerza. En este 
caso, nos limitamos a especificar, una vez más, lo que debe considerarse 
como una respuesta y nos negamos a aceptar los ejemplos que no lMe- 
guen a cumplir con la especificación. Una especificación es adecuada 
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si la entidad que describe da curvas suaves en lo que respecta a las 
leyes dinámicas. Dado que las leyes aplicables son las que afectan a la 
reserva, la prueba de que la respuesta es una clase de acontecimientos 
y que cualquier ejemplo particular de la misma posee propiedades irre- 
levantes se reduce esencialmente a una prueba de que las respuestas 
que poseen una propiedad irrelevante contribuyen o se sustraen de la 
reserva con la misma efectividad que las respuestas que no la poseen. 
Más tarde presentaremos muchos ejemplos concernientes a la conducta 
de una rata al accionar una palanca. El número de actos distingui- 
bles de la rata que producirán el movimiento requerido de la palanca 
es indefinido y muy grande. Constituyen una clase, que está suficiente- 
mente bien definida por la expresión “accionar la palanca”. Ya mos- 
traremos más tarde que la tasa de respuesta es significativa bajo 
diversas circunstancias. Se automantiene o varía con arreglo a ciertas 
leyes. Pero las respuestas que contribuyen a este número total por uni- 
dad de tiempo no son idénticas. Son seleccionadas al azar de entre la 
totalidad de la clase; esto es, por circunstancias que son independientes 
de las condiciones que determinan la tasa. Los miembros de la clase 
son mutuamente reemplazables, desde el punto de vista cuantitativo, 
a pesar de sus diferencias. Si sólo se contaran las respuestas que se 
hicieran de una forma muy especial (es decir, se se restringiera la res- 
puesta mediante una especificación más detallada), menguaría la sua- 
vidad de las curvas resultantes. Las curvas quedarían destruidas con 
la eliminación de muchas respuestas que contribuyeron a ellas. El 
conjunto de propiedades que definen “accionar una palanca” se deter- 
mina solamente de esta forma; el especificar más o menos destruiría 
la consistencia del resultado experimental. Podemos añadir que en el 
caso de la conducta operante condicionada la propiedad definitoria de 
una clase es exactamente la dada por las condiciones del reforzamiento. 
Si el reforzamiento dependiera, por ejemplo, de realizar la respuesta 
con un tipo determinado de músculos, la clase cambiaría a otra que 
quedara definida por aquella propiedad. Esta clase podría variar de 
otras formas, pero si restringiéramos los reforzamientos más y más po- 
dríamos acercarnos a una respuesta que dependiera de especificaciones 
muy rigurosas (ver capítulo 8). El punto que queremos poner ahora 
de relieve es que cuando el reforzamiento depende de una propiedad 
como “accionar una palanca”, las otras propiedades de la conducta 
pueden variar ampliamente, aunque se sigan obteniendo curvas suaves. 

Es cierto que las propiedades no definitorias, a menudo, no son 
totalmente negligibles y que, por tanto, los miembros de las clases no 
son mutuamente intercambiables. En el lado de la respuesta, los datos 
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no mostrarán esto, en muchos casos, a causa de la presente falta de 
precisión. Pero es cierto que hay miembros no incluidos en una clase 
que no tienen un poder sustitutivo pleno: es decir, hay flexiones y 
presiones que son tan poco corrientes a causa de otras propiedades que 
no pueden ser plenamente consideradas como tales. Hay que suponer 
que diferencias menores serían significativas en un test más sensible. 
Si examináramos un gran número de respuestas que conducen al mo- 
vimiento de la palanca, la mayor parte de ellas serían relativamente 
semejantes, pero habría grupos más pequeños que cobrarían relieve 
debido a propiedades distintivas y unas cuantas respuestas totalmente 
anómalas. En razón de su alta frecuencia de ocurrencia, las respuestas 
que son similares son típicas de la respuesta de “accionar la palanca”, 
pero debido también a esta frecuencia elevada cualquier falta de efec- 
tividad de las respuestas atípicas no es lo bastante grande para que, en 
la actualidad, podamos notarla. 

Por parte del estímulo, podemos demostrar pequeñas diferencias, 
puesto que, en este caso, controlamos los valores de las propiedades 
no definitorias y podemos acumular el efecto de una propiedad dada. 
Así, se puede mostrar que en el reflejo de flexión la fatiga en un punto 
de estimulación no produce la completa fatiga del reflejo en otro 
punto de estimulación. En este ejemplo, los estímulos particulares han 
sido segregados en dos grupos sobre la base de la propiedad de la 
localización, y queda patente la relevancia de la propiedad para la pro- 
ducción de un cambio secundario. En este caso es justificado hablar 
de diferentes reflejos en los dos puntos. Asimismo, en el ejemplo de 
accionar una palanca el reforzamiento se hace en presencia de una 
clase infinitamente grande de estímulos que proceden de la palanca 
y de distintas partes del aparato. Es posible controlar algunas de las 
propiedades de esos miembros. Por ejemplo, puede hacerse que la es- 
timulación de palanca actúe con luz o en la oscuridad, de tal modo 
que todas las propiedades que surjan como radiación visible puedan 
introducirse o eliminarse a voluntad. Más tarde mostraremos que éstas 
no son totalmente irrelevantes en la extinción subsiguiente de la ope- 
rante. En uno y otro caso, si hemos permitido que el estímulo varíe al 
azar con respecto a la propiedad no definitoria, debemos obtener cur- 
vas razonablemente suaves para los procesos dinámicos, de acuerdo 
con las normas de suavidad actualmente vigentes. Sólo podemos mos- 
trar su falta de equivalencia completa separando los estímulos en gru- 
pos. Una vez mostrado esto, ya no podemos desatender por más tiempo 
la importancia de la propiedad, aun en ausencia del agrupamiento. 

Esta demostración de la naturaleza genérica del estímulo y la res- 
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puesta no pretende traspasar los límites establecidos por el presente 
grado de precisión experimental, pero sus rasgos principales están de- 
masiado bien marcados como para verse seriamente perturbados por 
condiciones limitativas. Puede aparecer una consistencia práctica de 
las leyes dinámicas a tal nivel relativamente no restringido —y, como 
podríamos decir, tan espontáneamente— en la serie de entidades pro- 
gresivamente restringidas, que la extrapolación hacia la consistencia 
completa parece encontrarse algo lejos de la restricción completa. Sería 
ocioso considerar la posibilidad de detalles que en el momento pre- 
sente no tienen realidad o importancia experimental. Puede ser que 
la localización del estímulo para la flexión o las fuerzas que afectan 
al organismo cuando se acciona la palanca sean algo significativas en el 
punto de la especificación completa, pero en este momento estamos 
interesados solamente en el grado de consistencia que puede obtenerse 
cuando todavía no están en absoluto completamente determinadas. Es- 
ta consistencia es tan notable que sugiere la posibilidad de conseguir 
mejoras muy escasas mediante una restricción más estricta. 

La argumentación precedente puede resumirse como sigue. Puede 
restringirse una situación experimental por dos razones completamente 
diferentes, ya sea para obtener una mayor precisión de referencia (de 
forma que la descripción de una respuesta, por ejemplo, sea lo más 
completa y rigurosa posible) o ya sea para obtener curvas consistentes 
para los procesos dinámicos. El aumento de la precisión confiere una 
mayor autoridad al enunciado de una correlación, lo cual es deseable; 
pero no nos ayudará a decidir sobre una unidad. Conduce en última 
instancia a una entidad completamente restringuida, que generalmente 
es irreproducible y por lo demás poco práctica, de forma que es nece- 
sario detenerse en algún nivel arbitrario como por ejemplo en un com- 
promiso entre la precisión de referencia y el esfuerzo experimental de 
restricción. El segundo criterio, por otra parte, produce un elemento 
que no es en modo alguno arbitrario. La aparición de curvas suaves 
en los procesos dinámicos marca un punto único en la restricción pro- 
gresiva de una preparación, y es para esta entidad especialmente de- 
terminada que reservaremos el término de reflejo. Una respondiente, 
pues, considerada como una correlación entre un estímulo y una 
respuesta y una operante considerada como una parte funcional de 
la conducta son definidas a niveles de especificación señalados por la 
regularidad de los cambios dinámicos. 

Al decidirnos a favor de esta definición optamos por la simplicidad 
y la consistencia de los datos en contra de la reproductibilidad exacta 
tomada como criterio último, mitigando quizás el grado de exigencia 
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de la reproductibilidad exacta y usando la consistencia de los datos 
en nuestra defensa. Este sería un buen método científico si no nos 
viéramos inclinados a adoptarlo por otras razones. Insistir en la cons- 
tancia de las propiedades que puede mostrarse que no afectan a las 
medidas de que disponemos es convertir a la exactitud en un fetiche. 
La razón por la que tan a menudo se ha obrado de esta forma es obvia. 
En el caso de una respondiente lo que se desea es la correlación “nece- 
saria y suficiente” entre un estímulo y una respuesta. El procedimiento 
recomendado por el presente análisis consiste en descubrir las propie- 
dades definitorias de un estímulo y una respuesta y expresar la corre- 
lación en términos de clases. El sistema usual ha sido mantener cons- 
tantes, en la medida de lo posible, todas las propiedades de un término 
dado. En un caso que tiene éxito todas las propiedades parecen ser 
relevantes porque invariablemente ocurren en todas las ocasiones. Es 
casi como si, enfrentado a la evidente irrelevancia de muchas propieda- 
des, el fisiólogo reflexólogo hubiera inventado la situación experimental 
altamente restringida para hacerlas relevantes. Al dar una explicación 
completa de una sinación experimental restringida arbitrariamente, 
describimos, a un tiempo, demasiado y demasiado poco. Incluimos 
material que es irrelevante al dato principal de tal modo que esa parte 
de la descripción es superflua e ignoramos deliberadamente el carácter 
más amplio del estímulo y la respuesta. La misma argumentación se 
aplica a la conducta operante. La descripción completa de un acto de 
apretar la palanca sería muy poco útil, ya que la mayor parte de la 
información es irrelevante al hecho de la emisión, por el que nos inte- 
resamos ante todo, y no nos diría nada sobre el conjunto de propieda- 
des que conducen a un resultado consistente. 

Cierta cantidad de restricción es prácticamente indispensable. Tiene 
el mérito de mantener constante una propiedad definitoria aun cuando 
la propiedad no haya sido identificada. Hasta que hayamos descubierto 
una propiedad definitoria, es preciso recurrir a la restricción para ga- 
rantizar la validez última. Y dado que con frecuencia es difícil denotar 
claramente las propiedades definitorias, especialmente cuando los va- 
lores extremos de otras propiedades se interfieren con ellas, generalmente 
es necesario cierto grado de restricción a título de precaución. A me- 
nudo no es obvio que se use. Sería muy difícil definir la clase “accionar 
una palanca” sin una restricción considerable, a título de precaución, 
de propiedades esencialmente no definitorias como las concernientes al 
tamaño de la palanca, etc. El uso de un tipo uniforme de palanca de 
un experimento a otro constituye de por sí un considerable acto de res- 
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tricción y aparentemente es necesario para asegurar un resultado con- 
sistente. 

La liberación de la exigencia de la reproductibilidad completa en- 
sancha inconmensurablemente nuestro campo de operación. Ya no nos 
encontramos limitados por las muy escasas situaciones experimentales 
en que se puede hallar cierta semejanza de reproductibilidad completa, 
puesto que somos capaces de definir las “partes de la conducta y del 
ambiente” que tienen realidad experimental y que son reproducibles en 
su propia forma. En particular, la conducta del organismo intacto es 
susceptible de con una expectativa de precisión comparable a la de la 
preparación espinal clásica. En efecto, si tomamos la suavidad de los 
cambios dinámicos como criterio último, el organismo intacto a menudo 
muestra una consistencia mucho mayor que la preparación espinal uti- 
lizada en fisiología refleja, aun cuando el número de propiedades no 
definitorias incontroladas sea mucho menor en el último caso. Más 
adelante ya aportaremos pruebas sobre ello. 


La naturaleza genérica de los estímulos y respuestas no constituye 
en modo alguno una justificación de los términos más amplios del vo- 
cabulario popular. Ninguna propiedad es una propiedad definitoria 
válida de una clase hasta que se haya demostrado su realidad experi- 
mental, y esta regla excluye una gran cantidad de términos normalmente 
utilizados en la descripción de la conducta. Por ejemplo, cuando se 
observa casualmente que un niño se esconde al ser confrontado con 
un perro, puede decirse, según una extensión poco crítica de la termi- 
nología del reflejo, que el perro es un estímulo y el hecho de escon- 
derse una respuesta. Es obvio enseguida que la palabra “esconderse” 
no se refiere a un conjunto único de movimientos ni la palabra “perro” 
a un conjunto único de fuerzas estimulantes. Con objeto de hacer estos 
términos válidamente descriptivos, es preciso definir las clases a las que 
se refieren. Debe mostrarse qué propiedades de un estímulo hacen 
que pueda incluirse en la clase “perro” y qué propiedades de una res- 
puesta hacen que constituya un caso de “esconderse”. (No basta con 
dignificar el vocabulario popular recurriendo a las propiedades esen- 
ciales de la “calidad de perro” o de la “acción de esconderse” y supo- 
ner que las conocemos intuitivamente.) Debe mostrarse que las clases 
resultantes están correlacionadas experimentalmente, y también debiera 
mostrarse que los cambios dinámicos de la correlación están sometidos 
a leyes.* No es cierto en absoluto que las propiedades que, obrando 


5. Ya quedará claro más tarde que este ejemplo en realidad es más una 
operante discriminada que una respondiente. 
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de esta forma, resulten ser significativas sean las ahora supuestamente 

designadas por las palabras “perro” y “esconderse” aun después de te- 
P P Pp y 

ner en cuenta la inevitable vaguedad del término popular, 


La existencia de un término popular crea cierta presunción a favor 
de la existencia de un correspondiente concepto experimentalmente 
real, pero eso no nos libra de la necesidad de definir la clase y de 
demostrar la realidad si el término ha de usarse con fines científicos. 
Todavía está por demostrar que la mayoría de los términos extraídos 
del vocabulario popular son válidamente descriptivos, o sea que con- 
ducen a una experimentación consistente y reproducible. No podemos 
definir una respuesta como hace Watson (76) como “todo lo que el 
animal hace, como volverse hacia una luz o alejarse de ella, dar un 
brinco al oír un sonido, y actividades más altamente organizadas como 
construir un rascacielos, trazar planos, tener niños, escribir libros, etc.”. 
No hay razón para esperar que las respuestas del último tipo obedez- 
can a leyes dinámicas simples. El análisis no ha sido llevado basta el 
punto en que aparecen cambios ordenados. 


Esta restricción sobre el uso del vocabulario popular a menudo no 
se tiene en cuenta porque la legitimidad parcial del término popular 
a menudo acarrea cierta consistencia experimental. Es más probable 
que el experimentandor actúe de esta manera que no que dé con tér- 
minos experimentalmente reales, y puede tener un conjunto privado 
de propiedades, resultantes de su propia formación, que le sirvan. La 
palabra “oculto” puede siempre ser empleada por él en relación con 
acontecimientos que tengan ciertas propiedades definidas, y sus propios 
resultados serán consistentes en virtud de esta definición per accidens. 
Pero comete un error si supone que logra comunicar esas propiedades 
en su uso del término popular. Si no se da una especificación comple- 
mentaria más exacta, la dificultad se manifestará siempre que sus expe- 
rimentos sean repetidos por otro experimentador con otro conjunto de 
propiedades definitorias privadas y será tanto mayor cuanto mayor sea 
la diferencia de formación de ambos experimentadores. 


Esto plantea un problema epistemológico que es inevitable en un 
campo de este tipo. Debe suponerse que la relación del organismo con 
el medio incluye el caso especial de la relación del científico con el 
campo de estudio. Si contemplamos una eventual extensión fructífera 
de nuestros métodos, debemos suponer que nosotros mismos estamos 
describiendo una actividad de la que el hecho de describir constituye 
por sí solo una manifestación. Es necesario plantear esta cuestión epis- 
temológica para explicar por qué los términos populares con tanta 
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frecuencia se refieren a lo que más tarde resultarán ser entidades expe- 
rimentalmente reales. La razón es que tales términos son en sí mismos 
respuestas de tipo genérico: son las respuestas de la población de la 
que forma parte el experimentador. Por consiguiente, cuando el orga- 
nismo bajo investigación se asemeja mucho al hombre (por ejemplo, 
cuando es un perro), el término popular puede aproximarse mucho a la 
entidad experimentalmente real. El experimentador puede dar inmedia- 
tamente con la propiedad correcta del estímulo, no porque la haya ma- 
nipulado experimentalmente, sino porque él mismo reacciona en cierta 
medida de forma similar al perro. Por otra parte, si el organismo es por 
ejemplo una hormiga o una ameba, es mucho más difícil detectar la 
clase de estímulo real sin experimentación. Si no patrocináramos esta 
explicación, la legitimidad parcial del término popular sería una coin- 
cidencia sorprendente, que podría utilizarse (como de hecho se ha usa- 
do) como argumento para la admisión de un método especial como la 
“empatía”, la “identificación” o la “antropomorfización” (71), en el estu- 
dio de la conducta. Al insistir en que ninguna cantidad de realidad en 
los términos populares ya examinados nos disculpará de definir un nuevo 
término experimentalmente si tiene que usarse, estoy rechazando este 
proceso. La regla de que el término genérico pueda utilizarse sólo 
cuando se haya verificado su realidad experimental no admitirá la po- 
sibilidad de un principio subordinado, disponible en el estudio de la 
conducta y peculiar a él, que conduzca a la definición de conceptos a 
través de medios distintos de la clase de procedimiento experimental 
que hemos esbozado. 
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2. Ámbito y método 


La dirección de la investigación 


Por lo que respecta al método científico, el sistema establecido en 
el capítulo precedente puede caracterizarse de la manera siguiente : 
Es positivista. Se limita a la descripción más bien que a la explicación. 
Sus conceptos se definen en términos de observaciones inmediatas, y 
no se les confiere propiedades fisiológicas o locales. Un reflejo no es un 
arco, un impulso no es el estado de un centro, la extinción no es el 
agotamiento de una sustancia o estado fisiológicos. Los términos de 
esta índole se emplean simplemente para reunir grupos de observacio- 
nes, para enunciar uniformidades y para expresar propiedades de con- 
ducta que trascienden los casos singulares. No son hipótesis, en el sen- 
tido de cosas que hay que probar o rechazar, sino representaciones 
convenientes de cosas ya conocidas. En cuanto a las hipótesis, el sistema 
no las necesita, al menos en su sentido usual. 

Se objeta a menudo que un sistema positivista no brinda ningún 
incentivo a la experimentación. Se dice que las hipótesis, incluso las ma- 
las hipótesis, se justifican por su efecto de producir investigación (se- 
guramente también mala experimentación), y se implica o se mantiene 
que generalmente se tiene la necesidad de este tipo de herramientas. Se 
trata de una cuestión histórica sobre la motivación de la conducta hu- 
mana. Sin duda alguna hay muchos hombres cuya curiosidad por la 
naturaleza es menor que su curiosidad por la exactitud de sus pro- 
pios hallazgos, pero debe notarse que de hecho la ciencia progresa 
sin la ayuda de esta clase de profecías explicativas. Hay muchos argu- 
mentos a favor de la mayor eficacia del sistema descriptivo cuando está 
motivado. 

Sin embargo, aunque demos por sentado que dicho sistema posee 
ya la fuerza motriz indispensable, se puede todavía insistir en que una 
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ciencia simplemente descriptiva carece de dirección. Un hecho es un 
hecho, y el sistema positivista no parece preferir uno a otro. Se afirma 
que las hipótesis vienen a solventar este problema dirigiendo la elec- 
ción de los hechos (con frecuencia no se discute qué es lo que dirige 
la elección de las hipótesis), y se dice que sin ellas una distinción entre 
el hecho útil y el inútil sería imposible. Este punto de vista constituye 
una pobre concepción de una ciencia descriptiva. La mera acumulación 
de uniformidades no es una ciencia en absoluto. Es necesario organizar 
los hechos de tal forma que pueda darse de ellos una descripción sim- 
ple y conveniente, y para ello se requiere una estructura o sistema. Las 
exigencias de un sistema satisfactorio suministran toda la dirección en 
la adquisición de los hechos que pueda desearse. Aunque la historia 
natural haya marcado la pauta para la catalogación de instancias aisla- 
das de conducta curiosa, no hay peligro de que una ciencia de la conduc- 
ta alcance este nivel. 

La investigación que será descrita en este libro ha sido dictada por 
la formulación del sistema hecho en el capítulo anterior, y la dirección 
general de la indagación puede justificarse en base al sistema de la forma 
siguiente. Hay una falta de equilibrio en los tiempos presentes a favor 
de la conducta respondiente y en contra de la conducta operante. Ello 
se explica por razones históricas. El descubrimiento del estímulo como 
variable controladora constituyó el primer gran avance en la reducción 
de la conducta a una especie de orden, descubrimiento que naturalmen- 
te estimuló la investigación al traer a luz las relaciones estímulo-res- 
puesta. La investigación de los reflejos inferiores que dio comienzo con 
Marshall Hall y alcanzó su punto culminante con Sherrington, estable- 
ció el reflejo como un concepto válido y marcó la pauta para una inves- 
tigación análoga en el campo de la conducta superior. El descubri- 
miento de Pavlov del reflejo condicionado de tipo S surgió gracias al 
estudio de las respondientes alimentarias incondicionadas, y la mayor 
parte del trabajo realizado en el campo del condicionamiento se amoldó a 
este tipo. La primitiva aseveración de que los conceptos aplicables a-las 
respondientes espinales y a los reflejos condicionados de tipo S podía 
extenderse a la conducta en general ha retrasado la investigación de 
la conducta operante. Por lo tanto, hay una buena razón para dirigir la 
investigación hacia la obtención de un mejor equilibrio entre los dos 
campos, en especial si tenemos en cuenta que la mayor parte de la 
conducta del organismo intacto es operante. 

Una importante fase histórica de la investigación de las respondien- 
tes fue topográfica. Se descubrieron y se dio nombre a nuevos reflejos. 
Pero con la extensión del campo, gracias al descubrimiento del condi- 
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cionamiento y la comprensión de que los reflejos podían multiplicarse de 
manera infinita, el aislamiento y el nombramiento de los reflejos perdió 
gran parte de su importancia. En el campo de la conducta operante no se 
ha observado tendencia alguna hacia una fase comparable. La topo- 
grafía general de la conducta operante no es importante, porque la 
mayoría, si no todas, las operantes específicas son condicionadas. Su- 
giero que las propiedades dinámicas de la conducta operante pueden 
estudiarse con un solo reflejo (o al menos con los mínimos necesarios para 
asegurar la aplicabilidad general de los resultados). Si esto es así, no ten- 
dría por qué haber ningún incentivo para “inventariar”. La presente 
obra, por tanto, se limita a un solo reflejo: la conducta de apretar hacia 
abajo una barra horizontal o palanca. El único problema topográfico a 
considerar es la legitimidad de la definición de una respuesta en tér- 
minos de ciertas propiedades. Este problema es el de un elemento de 
conducta, estudiado al final del capítulo anterior, que se extiende en el 
trabajo presente al campo de la discriminación y a la necesidad de 
definir una discriminación en términos de reflejos relacionados. El pro- 
blema puede tratarse convenientemente con una sola operante. 

Los principales problemas en el área de la conducta residen en la 
dirección de las leyes de la fuerza del reflejo, y éste será el centro de 
interés del trabajo que va a seguir. Tengo la impresión de que la parte 
restante del área de estudio —la interacción de reflejos separados— 
(excepto la inducción y el encadenamiento) no puede investigarse con 
éxito hasta que sean mejor conocidas las leyes de fortalecimiento que se 
aplican al reflejo individual. Todavía no se ha alcanzado el estadio 
de combinar dos reflejos con objeto de observar la conducta resul- 
tante. La formulación y clasificación de los tipos de operaciones que 
inducen cambios de fuerza constituyen principalmente más un proble- 
ma de observación que de experimentación, pero el estudio cuantitativo 
de las leyes que rigen la relación entre las operaciones y los cambios 
son claramente experimentales. El problema central de este libro es la 
formulación de conducta, cuyo tratamiento se trata de que sea razona- 
blemente exhaustivo. El trabajo experimental cabe en el marco formula- 
tivo en la medida en que he sido capaz de realizar los experimentos 
llevados a cabo hasta el momento presente. 

El orden en que se consideran las leyes dinámicas viene determinado 
por la conveniencia experimental. El estudio de las variables que se 
mantienen constantes más fácilmente puede posponerse conveniente- 
mente en aras de un ataque experimental sobre lo menos manejable. 
La edad, lo ciclos sexuales y la salud afectan a la fuerza del reflejo, 
pero pueden volverse relativamente poco importantes usando organis- 
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mos machos en buen estado de salud en el período menos rápidamen- 
te cambiante de su ciclo vital. Las drogas y las técnicas quirúrgicas 
que afectan a la fuerza del reflejo pueden simplemente evitarse. La 
emoción puede eliminarse en su mayor parte mediante una manipula- 
ción cuidadosa, y la adaptación al aparato y al procedimiento. El im- 
pulso y el condicionamiento siguen siendo, pues, los dos principales fac- 
tores a investigar. Quizás son del mismo orden de tratabilidad. Cada 
uno de ellos puede mantenerse bastante constante cuando el otro está 
siendo estudiado. El condicionamiento se aborda primero en las pá- 
ginas siguientes porque hay mucho más que decir sobre él. Este plan 
en el procedimiento no implica que los factores no tratados no sean 
importantes en la descripción de la conducta, sino que simplemente 
siendo considerados como susceptibles de control, su estudio puede 
aplazarse hasta un estadio posterior de la investigación. 

Debe comprenderse claramente que este libro no constituye un re- 
paso o un resumen de la literatura sobre la conducta. Evita la explora- 
ción topográfica. En el capítulo consagrado al condicionamiento no pa- 
saré revista a todos los tipos de reflejos que se han condicionado; en el 
capítulo dedicado al impulso no trataré de mencionar todo el material 
disponible sobre los impulsos, etc. Mi interés radica únicamente en la 
formulación del material típico. Si no llego a discutir todo tipo de 
proceso sobre el que en la actualidad hay información fiable, ello cons- 
tituirá una grave omisión, pero deliberadamente pasaré por alto muchas 
importantes investigaciones que son topográficamente paralelas a las 
mencionadas. Tal vez debería decir algo sobre el uso casi exclusivo 
de mi propio material experimental en relación con la conducta ope- 
rante. No se trata en absoluto de la implicación de que éste es el único 
trabajo importante que se ha hecho en este campo, sino simplemente que 
no he tenido mucha suerte en encontrar material relevante en otras 
partes a causa de las diferencias de las formulaciones básicas y su efecto 
sobre la elección de las variables a estudiar. 


El organismo 


En el sentido más amplio, una ciencia de la conducta debe interesarse 
por toda clase de organismos, pero es razonable limitarse, al menos al 
principio, a un solo ejemplo representativo. En virtud de una cierta antro- 
pocentridad de nuestros intereses es probable que escojamos un organis- 
mo que, por una parte, sea semejante al hombre y, por otra, sea consis- 
tente con la conveniencia y el control experimentales. El organismo que 
utilizamos aquí es la rata blanca. Difiere del hombre en su equipamien- 


63 


to sensorial (especialmente en su visión más escasa), en sus capacidades 
reactivas (como las de las manos, laringe, etc.) y en las limitaciones en 
ciertas otras capacidades como la de formar discriminaciones. Tiene la 
ventaja sobre el hombre de que sus impulsos y rutina de vida pueden 
someterse al control experimental. Hay otros organismos que divergen 
menos en capacidad y que asimismo nos podrían servir a ese respecto, 
como el mono, el perro o el gato, pero la rata tiene las siguientes ventajas 
adicionales; es barata y se mantiene fácilmente; ocupa muy poco es- 
pacio en el laboratorio y es sorprendentemente estable frente a un largo 
y difícil tratamiento. Algunos de los procedimientos que describiremos 
más tarde no hubieran podido usarse con perros o con monos a causa 
de la tendencia de dichos organismos a desarrollar “neurosis” (64, 59). 
La rata también se adapta fácilmente al confinamiento y tiene una ven- 
taja a ese respecto, especialmente sobre el gato. Eso no significa 
que un resultado obtenido con una rata no sea aplicable a un gato, 
sino que el gato posee fuertes reflejos que entran en conflicto con un de- 
terminado procedimiento experimental que son débiles o inexistentes en 
el caso de la rata. El confinamiento se usa como medio de exclusión de 
los estímulos extraños, y es conveniente escoger un organismo para el 
cual esta exclusión pueda conseguirse de la forma más sencilla posible. 

Las ratas empleadas en los experimentos siguientes eran en parte 
miembros de la extensa familia de ratas albinas cruzadas entre sí y 
de una familia de ratas de cabeza negra asimismo entrecruzadas,' y en 
parte. ratas albinas comerciales procedentes de un origen no identifi- 
cado. Con muy pocas excepciones todas eran machos. La experimenta- 
ción generalmente daba comienzo a los cien días del nacimiento. Los 
grupos experimentales prácticamente siempre se constituían a base de 
ratas de una misma camada. Las ratas estaban sanas al inicio de los 
experimentos y se desechaban en caso de enfermedad. 


La operante 


La operante que he utilizado es la conducta de apretar hacia abajo 
una pequeña palanca. Una palanca típica consiste en una varilla de la- 
tón de 1/8 de pulgada y viene representada en el aparato de la figu- 
ra 1. La parte a que tiene acceso la rata es una sección horizontal de 
8 cm. de largo paralela a la pared de la caja experimental, aproxima- 
damente a 1 cm. de distancia de ella y de 8 a 10 cm. por encima del 
nivel del suelo. Para accionar la palanca hacia abajo la rata debe levantar 


1. Amablemente suministradas por el Dr. Gregory Pincus de los Laboratorios 
Biológicos de Harvard. 
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sus patas delanteras del suelo, poner una de ellas o ambas sobre la 
varilla, y apretar hacia abajo con unos 10 gramos de presión. El movi- 
miento vertical de la varilla permite un desplazamiento de unos 1,50 cm. 
de distancia. 

La selección de esta muestra de conducta operante se basa en las 
consideraciones siguientes : 

a) O bien es ína respuesta incondicionada prácticamente universal 
(si hay que considerarla como una conducta exploratoria incondiciona- 


*“—PANTALLA 
LUZ 


PALANCA 


Ficura 1 


CAJA EXPERIMENTAL TÍPICA 


Presentamos la sección de forma que aparezca la parte ocupada por el animal. 
El espacio situado detrás del tablero de la izquierda contiene el resto de la palanca, 
el almacén de comida y otras piezas del instrumental 


da) o bien no presupone una conducta manipulatoria condicionada que 
sea completamente extraordinaria para la especie. Menos del uno por 
ciento de las ratas que hemos utilizado no fueron capaces de emitir 
la respuesta en algún momento u otro. 

b) Tiene una frecuencia de ocurrencia conveniente antes de que 
tenga lugar el condicionamiento. Una rata no entrenada colocada en 
una pequeña caja con la palanca la apretará de una a diez o más veces 
por hora, dependiendo ello del hambre, la presencia de otros estímu- 
los, etc. Esto representa una cantidad de actividad “espontánea” ade- 
cuada para el condicionamiento de una operante. 
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c) Al mismo tiempo no ocurre tan frecuentemente sin condiciona- 
miento que el efecto del reforzamiento pueda quedar disimulado. A ese 
respecto puede contrastarse con la carrera, el levantamiento de la parte 
delantera del cuerpo hacia arriba, etc. 

d) No queda incluida en ninguna otra conducta significativa. La 
respuesta de flexionar una pata delantera, por ejemplo, podría ser una 
parte componente de las respuestas de arañar, comer, limpiarse el hoci- 
co, correr, saltar, etc. Una descripción de sus cambios de fuerza no 
tendría necesidad de tomar en cuenta todas esas diversas conductas. 
Dos dificultades de esta clase surgen en el caso de apretar una palanca, 
pero pueden eliminarse de la forma siguiente: 1) La palanca puede ser 
accionada cuando la rata está explorando el espacio de la pared situa- 
do encima de la palanca, pero eso puede corregirse proyectando la pa- 
red o una pantalla hacia adelante ligeramente por encima de la palanca 
(ver la figura). 2) En ciertos tipos de experimentos (que implican una 
reacción emocional) la rata puede roer la palanca e incidentalmente 
moverla arriba y abajo. Cuando es preciso, eso puede evitarse usando una 
palanca de un mayor diámetro (por ejemplo, 1,5 cm.) de manera que 
la acción de roer sea imposible o se vea rápidamente desalentada. 

e) La respuesta es relativamente inambigua. No hay dificultad 
en decidir si un movimiento dado debe contarse como una provocación 
O no, como sería el caso si la respuesta viniera definida por el movi- 
miento dado de una pata, por ejemplo. 

f) Se emite aproximadamente de la misma forma en cada ocasión. 
Las diferencias observadas en la práctica serán discutidas más tarde. 

g) Por último, la respuesta requiere una estimulación discrimina- 
tiva externa (proporcionada por la palanca). La naturaleza de ésta será 
considerada más tarde. Su presencia es necesaria por dos razones. Si 
la respuesta no precisara lo que Tolman (71) llama apoyo externo, po- 
dría ser emitida por el organismo fuera de la situación experimental, 
pero no podría tomarse ningún registro ni proporcionarse ningún re- 
forzamiesto. Los experimentos que se llevaran a cabo a lo largo de una 
serie de períodos experimentales se verían gravemente perturbados. En 
segundo lugar, la muestra debe ser discriminativa para poder ser tí- 
pica. Sería totalmente posible desde el punto de vista experimental 
usar un tipo de respuesta “sin soporte” como flexionar una pata o 
mover la cola, pero es sólo en la conducta verbal cuando son reforzadas 
estas respuestas ineficaces desde el punto de vista mecánico (es decir, 
cuando se convierten en gestos). En general, una respuesta debe actuar 
sobre el medio ambiente para producir su propio reforzamiento. Aun- 
que la conexión entre el movimiento de la palanca y el reforzamiento 
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es en cierto sentido artificial, guarda un estrecho paralelismo con la 
típica operante discriminada en la conducta normal de la rata. 

La respuesta de apretar una palanca satisface esos diversos requisitos 
con razonable éxito y es quizá óptima a ese respecto. Eso no quiere 
decir que las leyes a que se llega en este caso no pueden demostrarse 
- con otras clases de respuestas. El análisis necesario para la demostra- 
ción sería simplemente más difícil. Por ejemplo, si la respuesta formara 
parte de muchos tipos diferentes de conducta condicionada e incon- 
dicionada (ver d), pág. 66), las curvas obtenidas durante los diversos 
cambios de fuerza serían compuestas y altamente complejas, pero no 
por esa razón dejarían de estar menos sujetas a leyes. 

El reforzamiento de la respuesta se produce automáticamente con 
un almacén de comida que expulsa gránulos de tamaño uniforme en un 
comedero situado inmediatamente debajo de la palanca. Los gránu- 
los están hechos con un dispositivo similar a la “máquina de hacer 
píldoras” del farmacéutico y se componen de la comida normal con 
la que las ratas generalmente se alimentan. Cuando la palanca ha sido 
accionada y el gránulo ha sido ingerido, se deja a la rata aproximada- 
mente en la misma posición relativa a la palanca que tenía al principio. 


La secuencia completa de conducta consistente en levantar la parte 
anterior del cuerpo, apretar y soltar la palanca, dirigirse al comedero, 
coger el gránulo de comida, retirarlo del comedero y comerlo, por su- 
puesto, constituye un acto extremadamente complejo. Es una cadena 
de reflejos que para fines experimentales deben analizarse en sus partes 
componentes. El análisis se lleva a cabo más fácilmente observando la 
forma en que se adquiere la conducta. Al describir el material de esta 
índole es prácticamente indispensable un sistema de notación abrevia- 
do, y en este punto creo llegada la hora de introducir una tabla de sím- 
bolos que se utilizarán no sólo en esta discusión, sino a lo largo de todo 


el libro. 
Sistema de notación 


Los símbolos empleados y sus definiciones son los siguientes: 

S = estímulo 

R = respuesta 

S.R = respondiente 

s.R = operante (La fuerza que origina una operante se especifica 
en la formulación como s, aunque no esté bajo control experimental). 

Las propiedades de un término vienen indicadas por las letras en 
minúscula. Así, Sabc ... = un estímulo con las propiedades a, b, c ... 
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(longitud de onda, pauta, intensidad...). La ausencia de una propiedad 
es indicada con la letra griega correspondiente en minúscula. Así Ro = 
una respuesta que carece de la propiedad a. 

Los signos colocados en forma de exponente dicen algo sobre el 
término, se refieren a su lugar en una fórmula, etc., sin especificar sus 
propiedades. Ejemplos concretos (que definiremos más tarde) son: S' 
(estímulo reforzante), SP (estímulo discriminativo correlacionado con 
un reforzamiento) y S” (estímulo descriminativo negativamente correla- 
cionado con un reforzamiento). 

Un estímulo compuesto viene indicado por la yuxtaposición de sus 
partes sin puntuación como en sS” SP”, 

Cuando damos ejemplos se insertan después de los simbolos sepa- 
rados por dos puntos como en la expresión 5: shock. R: flexión. 

[ ] = “la fuerza del” reflejo que queda entre corchetes. Así [sS»". R], 
como veremos más tarde, representa “la fuerza de una operante en pre- 
sencia de un estímulo que está correlacionado con un reforzamiento y 
caracterizado como tal por la ausencia de la propiedad 1 

> = “seguido por”. Por ejemplo, más tarde podemos usar la ex- 
presión s. Ro—> S* para significar funa respuesta emitida sin relación 
con la estimulación discriminativa que es reforzada con tal que no 
posea la propiedad 4”. 


Análisis de la cadena 


La ley del encadenamiento se enunció en el capítulo 1 de esta for- 
ma: la respuesta de un reflejo puede producir la provocación o el es- 
tímulo discriminativo de otro. Éste es un principio de aplicación ex- 
traordinariamente amplia en la integración de la conducta. La mayor 
parte de los reflejos del organismo intacto son partes de cadenas. La 
muestra de conducta usada aquí es típica a ese respecto, y debemos 
afirmar cuidadosamente su naturaleza “molecular” (71). 

Los estadios posteriores de la conducta de apretar la palanca y de 
comer el gránulo son respondientes condicionados. Una rata hambrien- 
ta responderá al contacto de la comida sobre sus labios cogiéndola con 
sus dientes (y patas), masticándola, humedeciéndola con saliva, y tra- 
gándosela. La respuesta de coger la comida con la boca ha sido estu- 
diada por Magnus (61). La conducta de masticar y de tragar puede 
analizarse en una serie de reflejos más bien intrincada, que aquí no 
revisten demasiado interés.? La cadena es importante en el estudio 


2. Wright (79) enumera las siguientes etapas en el caso de la deglución 


humana : 
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de la conducta sólo hasta el momento en que la rata coge la comida, 
que puede representarse como S: comida. R: coger. 

Al principio de un experimento se coloca una rata hambrienta en 
la caja experimental que contiene el comedero durante períodos de, 
por ejemplo, una hora. Las respuestas exploratorias a las paredes de la 
caja, el comedero, etc., se provocan, pero pronto disminuyen, adaptán- 
dose y emitiéndose a una fuerza bastante baja. Sin embargo, el come- 
dero contiene comida y ciertos movimientos hechos por la rata en 
presencia de la estimulación del comedero y de las partes adyacentes de 
la caja se ven reforzadas por la acción de S: comida. Estos movimientos 
llegan a condicionarse plenamente y son realizados por una rata ham- 
brienta con considerable frecuencia. La respuesta es una operante dis- 
criminada, cuya naturaleza será investigada más o menos totalmente, 
más tarde. Podemos escribir sSP: comedero. R: acercamiento al 
comedero. La cadena queda dispuesta en este punto de la forma si- 
guiente: 


sSP; comedero. R: acercamiento >S: comida. R: coger. 


El próximo paso en la construcción de la muestra total es el esta- 
blecimiento de una discriminación “remota” (ver capítulo 5), en la que 
sS*: comedero. R: acercamiento se ve reforzado sólo cuando se pre- 
senta un estímulo discriminativo proporcionado por el sonido del alma- 
cén de comida. El comedero está vacío excepto después de que el al- 
macén ha dejado caer en él un gránulo de comida. La rata llega a 
responder al comedero cuando el almacén suena, pero en caso contrario 
eso no sucede con frecuencia. El reflejo reforzado puede representarse 


1) Después de la masticación, se forma un bolo alimenticio con la comida, 
el cual se desplaza hacia la parte posterior de la boca mediante la elevación de 
la parte anterior de la lengua. El milohioideo se contrae y el bolo se empuja 
hacia atrás por entre los pilares de las fauces. 

2) Los nervios sensoriales de la entrada de la faringe son estimulados, y 
reflejamente, a través de los centros medulares, resulta el siguiente movimiento 
coordinado complejo: 

a) Se eleva el paladar blando y la pared postfaríngea pandea hacia adelante 
para cerrar las fosas nasales posteriores. 

b) Los pilares posteriores de las fauces se aproximan para cerrar la cavidad 
bucal. 

c) La faringe queda ocluida por la base de la lengua y las cuerdas vocales se 
aproximan. 

d) La epiglotis hace las veces de plano inclinado para guiar el bolo después 
de la apertura laríngea. 

e) La respiración queda inhibida. 

f) Los músculos constrictores superiores se relajan para recibir el bolo. 

g) Una onda peristáltica empuja la comida a lo largo del esófago. 
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sSD: comedero. SP: sonido. R: acercamiento. Como mostraremos en el 
capítulo 6, el sonido del almacén ahora adquiere un poder reforzante y 
puede añadirse otro eslabón de la cadena, a saber, apretar la palanca, 
que produce el sonido del almacén debido a un mecanismo interno 
del aparato. La respuesta a la palanca depende de la estimulación dis- 
criminativa proporcionada táctilmente por la misma palanca y el re- 
flejo puede representarse : 


sSP; palanca táctil. R: pulsación. 


Un nuevo eslabón se añade a la cadena, ya que la estimulación tác- 
til de la palanca refuerza todas las respuestas hacia la palanca que la 
producen. Esta respuesta es también una operante discriminativa que 
puede representarse gráficamente sSP: palanca visual (o estimulación 
de las partes adyacentes del aparato). R: levantamiento de las manos 
y de la parte delantera del cuerpo. La cadena completa puede 'repre- 
sentarse como Sigue: 


sSP: palanca visual. R: levantamiento >sSP; palanca táctil. R: pul- 
sación > sSD: comedero. SP; sonido del almacén. R: acercamiento al 
comedero -> S: comida. R: coger, 


en que se entiende que la segunda flecha conecta la respuesta con SP: 
sonido solamente. Prescindiendo de los nombres de los términos, nu- 
merando las partes y omitiendo la estimulación discriminativa propor- 
cionada por el comedero en ausencia del sonido del almacén, tenemos: 


58D IV, RIV—> SU, RU > g8DI, RU-—> SI Ri 


que representa la estructura final de la conducta. 

De esos cuatro reflejos, a continuación solamente registraremos y 
estudiaremos el reflejo 1, pero es posible dar una buena explicación 
de la totalidad de la cadena mediante este único eslabón. Toda ocurren- 
cia del reflejo IV es seguida casi invariablemente por el reflejo UI (si 
se toca la palanca, se aprieta), y toda ocurrencia del reflejo 111 implica 
la ocurrencia de IV (si se aprieta la palanca es que ha sido tocada). 
Cuando el encadenamiento está intacto, los reflejos II y 1 prácticamen- 
te siempre se siguen. Sin embargo, el encadenamiento se halla bajo 
control experimental, y el efecto de romper la cadena será estudiado 
en ciertos casos. El uso de una cadena no puede evitarse al tratar del 
condicionamiento operante porque el mismo acto del reforzamiento 
la implica. Como ya he dicho, se podría haber usado un ejemplo más 
simple haciendo al reflejo TIT independiente de los estímulos discrimi- 
nativos externos, por ejemplo, empleando una mera flexión de un 
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miembro, pero hubiera sido menos típico de la conducta normal del 
organismo. 

El encadenamiento no es peculiar a la conducta operante. El ejem- 
plo de la deglución descrito anteriormente (ver nota al pie de la pá- 
gina 52) es casi enteramente respondiente. Magnus (61), en su obra 
sobre la postura y la progresión, da excelentes ejemplos del análisis 
de cadenas de respondientes. El principio es el mismo, con la ligera 
excepción de que en el caso de las operantes las respuestas producen 
estímulos discriminativos en vez de provocadores. 

En todo caso, lo que tenemos es una cadena de reflejos, no un 
“reflejo encadenado”. Las conexiones entre las partes son puramente 
mecánicas y no pueden romperse a voluntad. Cualquier sección de la 
cadena puede provocarse aisladamente con las mismas propiedades 
que la caracterizan como parte de la cadena total. No hay razón para 
denominar “acto” a toda propiedad única de la secuencia total. Hago 
esta toma de posición de la forma lo más explícita posible en vista de 
las opiniones prevalentes en sentido contrario. La justificación expe- 
rimental de la presente concepción “molecular” se irá acumulando a 
lo largo del resto de esta obra. 


Control de los factores extraños 


Sea cual sea la efectividad que los experimentos que describiremos 
más adelante puedan tener a la hora de revelar las uniformidades de la 
fuerza del reflejo, ésta es debida a los procedimientos a través de los 
cuales se aísla a éste y mediante los cuales se controlan los factores 
extraños que afectan a aquélla. Una primera precaución es la elimi- 
nación de los estímulos que provocan otros reflejos, cuya necesidad 
deriva evidentemente de la formulación hecha en el capítulo 1. No pue- 
den eliminarse todos esos estímulos, pero puede conseguirse un aisla- 
miento casi total realizando los experimentos en una caja insonorizada, 
oscura, de paredes lisas y bien ventilada como la mostrada en la 
figura 1. Los estímulos que quedan son principalmente los sonidos pro- 
ducidos por los propios movimientos de la rata y la estimulación táctil 
de la caja. Colocando el techo fuera del alcance de la rata, una pared 
queda efectivamente eliminada. El tamaño del suelo de la caja debe 
determinarse llegando a un compromiso entre el tamaño mínimo que 
representa la superficie estimulante lo más reducida posible y el tama- 
ño máximo que no provoque ninguna respuesta que coartar. Las cajas 
que he usado varían entre 10 cm. X 20 cm. y 30 cm. Xx 35 cm. en su 
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base. Los reflejos como respuesta a las paredes y los estímulos inci- 
dentales producidos por la misma rata se adaptan rápidamente, y la 
rata permanece en un estado relativamente inactivo hasta que se es- 
tablecen reflejos específicos en respuesta al comedero y a la palanca. 
La ventilación de la caja se consigue extrayendo el aire de la caja 
mediante un pequeño tubo no representado en la figura. 

El control del impulso (en este caso el hambre) no se logra tan fá- 
cilmente. Para la mayor parte de los propósitos debe reproducirse el 
mismo grado de impulso en días sucesivos, y en muchos casos el grado 
debe variarse de una forma conocida. Contra el uso de períodos diferen- 
tes de ayuno puede ponerse la objeción de que el organismo no come 
continuamente. Si fuera cierto que la comida se ingiere a un ritmo es- 
table (necesariamente bajo), mediante la interrupción del suministro 
de comida en diferentes períodos de tiempo antes del experimento sería 
posible obtener un escalonamiento de grados de hambre que tuvieran 
alguna relación (no necesariamente lineal) con las duraciones del ayu- 
no. Pero la rata ordinariamente limita su actividad de ingestión de co- 
mida a unos cuantos períodos durante el día, y el efecto en gran parte 
depende del estado del organismo poco antes de empezar el ayuno. El 
método es válido sólo cuando no importa la irregularidad debida a 
este factor, o sea durante ayunos del orden de varios días. Estos ayu- 
nos ocasionan grados extremos de hambre, que se ven complicados por 
otros factores, y el método es inadecuado bajo muchos aspectos. 

La ingestión de cantidades limitadas de comida diariamente también 
producirá cambios progresivos en el hambre a menos que las canti- 
dades sean escogidas de forma adecuada. La modificación de las can- 
tidades a medida que cambia el peso de la rata evitará los cambios 
progresivos prolongados, pero probablemente constituye un ajuste de- 
masiado lento para proporcionar un hambre uniforme de un día a otro. 

Ha sido posible reproducir un grado dado de impulso en días su- 
cesivos mediante el procedimiento siguiente: se establece un programa 
de alimentación diaria para la rata, según el cual se le permite comer 
libremente una vez al día durante un período de tiempo definido. Con 
comida seca puede ser aconsejable un período de alimentación de una 
o dos horas; con pienso bastará sólo un período de diez minutos. La 
comida que he usado es el alimento usual para perros (Purina Dog 
Chow),* que es capaz de mantener a las ratas en buen estado de salud 
durante varios meses sin necesidad de una dieta complementaria. Trans- 
currida casi una semana con este procedimiento, se consigue cada día, 


3. Literalmente, purina para perros pequineses. (N. del T.) 
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poco antes de la hora de la comida, un grado de hambre elevado y 
esencialmente constante. En los capítulos 4 y 10 ya aportaremos prue- 
bas de dicha constancia. A partir de este valor esencialmente máximo 
se pueden alcanzar diversos estados inferiores suministrando cantida- 
des uniformes de comida, como también mostraremos más tarde. Dado 
que la sed afecta al hambre, la rata tiene acceso en todo momento a 
un recipiente de agua. El “ciclo de hambre” obtenido de esta forma 
está en función de los estímulos externos que actúan como una especie 
de reloj. Puede mantenerse con éxito solamente si se mantienen cons- 
tantes las condiciones vitales de la rata. El ciclo está asimismo en fun- 
ción de la temperatura y quizá también de la humedad. En la mayoría 
de los casos presentes las ratas permanecieron, entre los experimentos 
en una habitación oscura e insonorizada, a una temperatura de 75* 
a 80”, variando para cada uno de los experimentos en menos de un gra- 
do. La humedad no fue controlada. 

Los experimentos se llevan a cabo a la hora usual de la comida para 
poder así aprovecharse de la constancia del punto máximo del ciclo. 
Cuando en el experimento se usan pequeñas cantidades de comida, 
sin embargo, la mayor parte de la ración debe dársela más tarde, y ello 
entraña una dificultad. Si se repite un experimento durante varios días 
sucesivos, el punto máximo del ciclo puede pasar del principio al fin 
de la hora experimental. Se pueden obtener pruebas de dicha variación 
independientemente del estudio de la actividad espontánea de la rata 
(ver capítulo 9). Para eliminar esta variación, los experimentos pueden 
llevarse a cabo sólo en días alternos, siendo alimentados los animales 
en los días intermedios en sus jaulas-hogares al principio de la hora 
del experimento. En muchos de los experimentos aquí descritos, en los 
que se extendía un proceso a lo largo de un período de varios días, se 
utilizó este procedimiento. En la descripción se pasan por alto los días 
intermedios, así que la expresión “el día anterior” debe entenderse 
como el día experimental anterior, con un día no experimental inter- 
medio omitido. 

La eliminación de los estímulos extraños surte el efecto adicional 
de evitar muchas de las fuentes de cambio emocional. La precaución 
principal que debe tomarse consiste en el manejo de los animales al 
inicio de un experimento. Los efectos de la manipulación pueden mini- 
mizarse reteniendo a la rata detrás de una puerta de acceso cuando es 
puesta en la caja experimental y que le permite permanecer allí duran- 
te un minuto o dos después de que se cierre la caja y antes de que dé 
comienzo el experimento propiamente dicho. La puerta de acceso debe 
ser razonablemente silenciosa al abrirse y cerrarse y debe permanecer 
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fuera del alcance de la rata cuando está abierta. El dibujo de la figu- 
ra 1 muestra la situación de dicha puerta. Es operada por una proyec- 
ción del eje sobre el que está montada y se mantiene pegada al techo 
cuando está abierta. 

Aunque nunca he repetido los experimentos sin precauciones de 
este tipo, creo que la regularidad de los datos obtenidos es un buen 
signo de su efectividad. 


La medición de la conducta 


El problema del registro de la conducta por lo general se resuelve 
fácilmente. Comparada con los datos de muchas otras ciencias, la con- 
ducta es macroscópica y lenta. Una sola cámara de cine proporcionará 
la mayor parte de la información requerida de una forma conveniente, 
aunque una batería de cámaras y un magnetófono, por supuesto, no 
están de más. Pero no debe confundirse un simple registro, en el sen- 
tido de un retrato o representación, con la medición. Por completa que 
sea, una representación no constituye más que el principio de una cien- 
cia. Lo que hace —tanto si se obtiene con un sistema de notación como 
si se obtiene mediante un procedimiento fotográfico y fonográfico— 
es permitir sosegadamente la inspección y la medición. El más comple- 
to y riguroso registro de la conducta difiere de la conducta en si sólo 
en cuanto puede pasarse lentamente, pararse o repetirse a voluntad. 

Por lo que se refiere a la medición, gran parte de los detalles de 
una representación completa son innecesarios e incluso inconvenientes. 
No me refiero aquí a la medición general de la conducta que produce 
una especie de narración cuantificada, sino a la medición que presupone 
un sistema analítico y selectivo. La necesidad de cuantificación en el 
estudio de la conducta se comprende bastante bien, pero ha conducido 
con frecuencia a una especie de oportunismo. El experimentador toma 
sus medidas donde puede hallarlas y se siente satisfecho si son de ca- 
rácter cuantitativo aun cuando sean triviales o irrelevantes. Dentro 
de un sistema que presente un rigor razonable puede estimarse la im- 
portancia relativa de los datos y pueden evitarse gran parte de las me- 
diciones inútiles. Con una formulación sistemática de la conducta es 
generalmente posible saber de antemano qué aspecto de la conducta 
va a variar durante un proceso determinado y, por lo tanto, lo que debe 
medirse. En el caso presente, están relacionados con el problema de 
la medida que debe tomarse los siguientes aspectos del sistema: 1) la 
definición de la conducta como aquella parte de la actividad del orga- 
nismo que afecta al mundo exterior; 2) el aislamiento práctico de una 
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unidad de conducta; 8) la definición de una respuesta como clase de 
acontecimientos, y 4) la demostración de que la tasa de respuesta cons- 
tituye la medida principal de la fuerza de una operante. De ello se 
desprende que el principal dato a medir en el estudio de las leyes diná- 
micas de una operante es el espacio de tiempo que transcurre entre 
una respuesta y la respuesta que la precede inmediatamente o, en otras 
palabras, la tasa de respuesta. 

A ello se podría objetar que una información distinta de la tasa de 
respuesta seguramente no sería nociva y que podría ser interesante e 
incluso valiosa. Es cierto que los registros fotográficos simultáneos hu- 
bieran sido útiles quizás en el uno por ciento de los casos siguientes; 
dejando eso aparte, debemos tener en cuenta consideraciones prácticas 
opuestas. Registrando la tasa de respuesta solamente, ha sido posible 
que una persona estudiara aproximadamente dos millones de respuestas 
en un plazo de seis años. Con pocas excepciones, de cada respuesta sólo 
sabemos una cosa: la duración del período de tiempo que transcurrió 
entre ella y la respuesta anterior. Este solo dato es suficiente para los 
propósitos de la presente formulación, y el resultado es, a mi juicio, 
más valioso de lo que hubiera sido una descripción más completa de 
una pequeña parte del mismo material. 

El movimiento de la palanca queda eléctricamente registrado como 
una gráfica del número total de respuestas con respecto al tiempo. El 
aparato que se precisa consiste de un quimógrafo lento y una plumilla 
que se desplaza verticalmente. A cada respuesta la plumilla se despla- 
za a una distancia uniforme gracias a un trinquete operado eléctrica- 
mente, Así se obtiene una línea quebrada progresiva, cuya pendiente 
es proporcional a la tasa de respuesta. Se escogen la velocidad del qui- 
mógrato y la altura del diente para dar una pendiente conveniente a 
las tasas de respuesta más frecuentes. En la figura 2 damos algunas 
pendientes representativas de los valores coordinados usados en la ma- 
yor parte de nuestra explicación. El carácter quebrado de la línea no 
aparece en la figura. (El movimiento de la palanca opera el registrador 
cerrando un interruptor de mercurio en el otro lado del panel en que 
está aplicada la palanca. En los primeros experimentos con este mé- 
todo, una aguja conectada con el brazo de la palanca estaba sumergida 
en un pequeño recipiente de mercurio. Cuando la palanca se despla- 
zaba lentamente el contacto tenía una tendencia a la vibración, y eso se 
corregía insertando en el circuito hacia el registrador un dispositivo 
que hacía imposible que se registrara un segundo contacto en el plazo, 
por ejemplo, de un segundo. Luego descubrimos que un interruptor de 
tubo de mercurio comercial no requería esta precaución.) 
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Con un registro de este tipo es posible examinar de una ojeada el 
estado de un reflejo y sus diversos cambios de fuerza durante un pe- 
ríodo experimental. La forma del registro está especialmente adaptada 
al estudio de las leyes dinámicas. Es cierto que a menudo nos interesa- 
mos más en el curso del cambio de tasa que en el número total de 
respuestas, pero es mucho más fácil registrar las respuestas de la rata 
en una curva acumulativa o integral que en una diferencial. Cuando 


RESPUESTAS 


TIEMPO 


Ficura 2 


EjempLos DE PENDIENTES OBTENIDAS CON LAS COORDENADAS MÁS FRECUENTEMENTE 
UTILIZADAS EN LOS CAPÍTULOS SIGUIENTES 


Se indica el número de respuestas por minuto representadas por cada pendiente. 
Los registros reales tienen forma de línea dentada 


estamos interesados en la tasa, las curvas deben leerse con respecto a 
Sus pendientes. A menudo es conveniente disponer de una gráfica que 
muestre la tasa con respecto al tiempo, y más adelante damos muchos 
ejemplos de ello. Sin embargo, no he convertido todos los registros a 
esa forma, en parte porque deseo permanecer lo más cerca posible de 
los datos experimentales, pero también porque la curva acumulativa 
tiene una ventaja especial al enfrentarnos con la noción de reserva y 
con sus efectos subsidiarios (como la compensación de sus desviaciones 
temporales). 

Los registros de este tipo se clasifican y archivan fácilmente, y pro- 
porcionan una permanente expresión de la conducta de primera mano. 
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Hay que señalar que en ningún momento el experimentador interviene 
con fines de interpretación. Todas las curvas dadas en este libro (ex- 
cepto las obtenidas promediando o las que se extienden a lo largo de 
una serie de días) son reproducciones fotográficas de registros hechos di- 
rectamente por las mismas ratas. La presencia del experimentador no es 
necesaria después de iniciado el experimento. Muchas de las cifras que 
reproducimos más tarde fueron tomadas in absentia. A causa del carác- 
ter automático del aparato es posible realizar varios experimentos si- 
multáneamente. Generalmente, he trabajado con series de cuatro, aun- 
que en ciertos casos he llegado a estudiar al mismo tiempo hasta doce 
animales. 
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3. Condicionamiento 
y extinción 


El proceso del condicionamiento 


“El término “condicionado” se está empezando a emplear cada vez 
de forma más general, y creo que su uso está plenamente justificado por 
cuanto, comparado con los reflejos innatos, esos nuevos reflejos real- 
mente dependen de muchísimas condiciones, tanto en su formación 
como en el mantenimiento de su actividad fisiológica. Claro está, los 
términos “condicionado” e 'incondicionado” podrían reemplazarse por 
otros de igual mérito. Así, por ejemplo, podríamos retener el término 
de R “reflejos innatos” y llamar al nuevo tipo “reflejos adquiridos”; o 
llamar a los primeros reflejos de la especie”, ya que son característicos 
de la especie, y a los segundos “reflejos individuales”, puesto que va- 
rían de animal a animal dentro de la especie, e incluso en el mismo 
animal en tiempos diferentes y bajo condiciones diferentes.” 

Esta cita de Pavlov ([64], p. 5) puede ser útil para explicar el uso 
del término “condicionado”. Denota una clase de reflejos que son con- 
dicionales respecto a cierta operación ejecutada sobre el organismo (lla- 
mada reforzamiento). El término francés (les réflexes conditionnels) es 
más acorde con este significado. Un reflejo condicionado puede iden- 
tificarse como tal mostrando, no que no existía en el momento del na- 
cimiento (un reflejo incondicionado puede “madurar” más tarde y un 
reflejo condicionado puede desarrollarse antes), sino que no existía 
hasta que se ejecutó la operación del reforzamiento. También puede 
distinguirse mostrando que mediante su provocación sin reforzamiento 
queda eliminado del repertorio del organismo. 

El énfasis en la cita sobre un tipo de reflejo es desafortunado. Si 
exceptuamos su dependencia con respecto al reforzamiento, el reflejo 
condicionado se comporta con relación a otras operaciones igual que 
cualquier otro reflejo. Lo importante es el proceso del condicionamien- 
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to y su proceso recíproco de extinción. Los cambios de fuerza efectua- 
dos por el reforzamiento continúan después de que el reflejo haya sido 
adquirido y después de que la distinción entre innato y adquirido se 
haya vuelto trivial. Incluso puede mostrarse que el condicionamiento 
puede tener lugar cuando no se ve involucrada la creación de un re- 
flejo topográficamente nuevo, como cuando el efecto del reforzamiento 
es aumentar la fuerza de un reflejo que corre paralelo con uno ya exis- 
tente. (Por ejemplo, se hace preceder la administración de comida por 
la introducción en la boca de una débil solución de ácido. Al final la 
secreción que sigue al ácido es predominantemente condicionada, pero 
el reflejo S: ácido. R: salivación no es topográdicamente nuevo.) To- 
dos los reflejos están sujetos a una modificación experimental de fuerza. 
El cambio de fuerza llamado condicionamiento se distingue simple- 
mente por la operación específica que lo ocasiona. El estudio del 
condicionamiento no es el estudio de un tipo de reflejo, sino el de la 
operación de reforzamiento y su efecto sobre la fuerza del reflejo. 

La operación del reforzamiento se define como la presentación de 
un cierto tipo de estímulo en una relación temporal con un estímulo o 
bien con una respuesta. Un estímulo reforzante se define como tal por 
su poder de producir el cambio resultante. No hay ninguna circulari- 
dad en ello; resulta ser que ciertos estímulos producen el cambio, y 
que otros no, y por ende se clasifican como reforzantes y no reforzan- 
tes. Un estímulo puede poseer el poder de reforzar cuando se presenta 
por primera vez (cuando es generalmente el estímulo de una respon- 
diente incondicionada) o puede adquirir ese poder mediante el condi- 
cionamiento (ver el capítulo 6). 


El condicionamiento tipo S 


En el capítulo 1 ya señalamos que existen dos tipos de reflejo con- 
dicionado que se definen según el estímulo reforzante se correlaciona 
con un estímulo o con una respuesta. El caso que implica una correla- 
ción con un estímulo (tipo S) puede representarse como sigue: 


so . (R9) 

SARA 
en que S” es un estímulo que provoca la respuesta irrelevante R”, pero 
(en el caso típico) no provoca R' antes del condicionamiento, y en que 
S' es un estímulo reforzante que provoca R!. En el ejemplo típico S* 
es un tono, S' la introducción de comida en la boca, y R' la salivación. 
Los requisitos del condicionamiento son cierta fuerza de SR! en el 
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momento y la presentación aproximadamente simultánea de los dos 
estímulos. El resultado es un incremento de (S”.R'). El reflejo puede 
tener una fuerza cero antes del condicionamiento. El cambio se produce 
en una dirección solamente —un aumento de fuerza— y difiere a ese 
respecto del condicionamiento del tipo R en el que puede implicar una 
disminución. El presente tipo se limita a las respondientes y es el tipo 
originalmente estudiado por Pavlov. 

Como quiera que el condicionamiento es un cambio en la fuerza de 
S* Ri, que constituye una respondiente, se mide en términos de pro- 
piedades estáticas. Pavlov emplea la razón R/S (incluyendo la postdes- 
carga) y la latencia, esto es, el efecto del reforzamiento es observado 
como un incremento de la magnitud de R' en respuesta a un S” de in- 
tensidad y duración constante o como una reducción del tiempo que 
transcurre entre la presentación de S* y el inicio de R'. La fuerza pue- 
de medirse solamente cuando no se presenta S', 

Podemos enumerar algunos de los factores que afectan a la tasa de 
condicionamiento. En general, faltan determinaciones cuantitativas de la 
tasa en función de esas variables. 

Propiedades de S”. En el experimento usual $” es un estímulo poco 
intenso que no provoca ninguna respuesta incondicionada de cierta im- 
portancia. Según Pavlov ([64], p. 29), “los reflejos condicionados se 
forman muy fácilmente con estímulos a los que el animal es más o me- 
nos indiferente al principio, aunque estrictamente hablando no existe 
ningún estímulo dentro del radio de percepción del animal al que sea 
absolutamente indiferente”. Los estímulos pueden disponerse ordena- 
damente según sus tasas de condicionamiento correspondientes. Por 
ejemplo, con un reforzamiento común (comida) se estableció un reflejo 
salival condicionado a la estimulación visual a partir de un objeto ro- 
tativo en cinco presentaciones combinadas, pero a un zumbador en sólo 
una. Con un reforzamiento diferente (ácido) el olor de amil acetato 
requirió 20 presentaciones. Los estímulos que pertenecen a reflejos 
fuertes pueden interferirse en el proceso de condicionamiento, proba- 
blemente porque producen cambios emocionales, pero ello no obstante 
el condicionamiento puede efectuarse en muchos casos. Pavlov nos ha- 
bla del condicionamiento de una respuesta alimentaria a una fuerte co- 
rriente eléctrica que originalmente provocó una violenta respuesta 
“defensiva”. La respuesta defensiva se adaptó completamente durante 
el condicionamiento, pero, como muestra el resumen de pruebas de 
Hull (48), este resultado no es universal. 

Propiedades de S' . R*. Debe notarse particularmente la estipulación 
de que S*.R*, debe poseer una fuerza considerable. La mera presenta- 
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ción simultánea de dos estímulos, cuando ninguno de ellos evoca una 
respuesta, según el tenor de esta ley, no surte ningún efecto. Esta es- 
tipulación explica el fracaso de aplicar la fórmula con éxito a muchos 
ejemplos de aprendizaje mediante contigiiidad temporal. Ello también 
significa que el organismo debe estar despierto y que el impulso 
básico subyacente a S! . R! debe ser fuerte. Un reflejo condicionado ali- 
mentario es fácilmente establecido en un perro hambriento, pero en 
uno que acabe de comer se establecerá lentamente o no se establecerá 
en absoluto. 

La relación temporal de S* y S!. La relación precisa de los estímulos 
viene expresada por Pavlov de la manera siguiente: “El requisito fun- 
damental es que todo estímulo externo que va a convertirse en la se- 
ñal en un reflejo condicionado debe superponerse por lo que toca al 
tiempo con la acción de un estímulo incondicionado... Es igualmente 
necesario que el estímulo condicionado empiece a operar antes de que 
el estímulo incondicionado entre en acción” ([64], pp. 26-27). La pro- 
pia obra de Pavlov ha mostrado que la superposición en el tiempo no 
es una condición necesaria, aunque pueda contribuir en gran parte al 
desarrollo del condicionamiento. El orden temporal ha sido discutido. 
Hull (48) ha resumido la evidencia en este punto y ha concluido que 
el condicionamiento “retardado” (el condicionamiento en que $” sigue 
a S») es posible. No obstante, los dos ejemplos que cita (los experimentos 
realizados por Switzer y Wolfle) no son inequívocamente de este tipo, 
como ya mostraremos más tarde (capítulo 6). 

El curso del cambio. Sorprendentemente se ha trabajado poco en 
la curva de la “adquisición” de un reflejo condicionado tipo S. Hull (48) 
ha resumido la evidencia para mostrar que el incremento de fuerza se 
ve positivamente acelerado al inicio del proceso. Ya que la fuerza 
al final alcanza un punto máximo, una curva en forma de S probable- 
mente caracteriza el proceso. Es difícil obtener curvas suaves a causa 
de la condición complicante de que al medir la fuerza debe retirar- 
se S', un acto que en sí afecta a la fuerza. Retrasar la presentación de S' 
hasta que $” haya tenido lugar no constituye una solución de esta di- 
ficultad porque introduce un elemento temporal de cierta importancia 
para el condicionamiento (ver capítulo 7). 


LA EXTINCIÓN TIPO S 


La extinción de un reflejo condicionado tipo $ ocurre cuando se 
presenta S” sin S', El cambio resultante incide en la fuerza de S* , R' y 


81 


es idéntico al del condicionamiento si exceptuamos su signo. Se mide 
de la misma forma —generalmente en términos de la razón R/S o de la 
latencia. El enunciado de Pavlov de que “la tasa de extinción experi- 
mental se mide por el período de tiempo que un estímulo dado debe 
aplicarse a intervalos regulares definidos sin reforzamiento antes de 
que la respuesta del reflejo tenga un valor cero” (64), es insatisfacto- 
rio. La tasa momentánea de extinción es la tasa en que la fuerza dis- 
minuye. Está probablemente en función de la fuerza en un momento 
concreto, pero no necesariamente de la fuerza con que el proceso em- 
pezó, aunque esta última está incluida en la “tasa” de Pavlov. 

La tasa de extinción se ve perturbada bastante fácilmente por fac- 
tores extraños. El mismo acto de retirar el reforzamieno puede ser un 
ejemplo; no sólo puede causar la reducción de fuerza llamada extin- 
ción, sino que también puede ocasionar un estado emocional que pro- 
voque una fluctuación en el estado del reflejo. El tiempo total requerido 
para la extinción a una tasa determinada de provocación está en fun- 
ción de la magnitud del condicionamiento que previamente ha tenido 
lugar y del estado momentáneo del impulso. Evidentemente, también 
está en función de la tasa de provocación. En un experimento llevado a 
cabo por Pavlov, la extinción se obtívo en 15 minutos cuando el inter- 
valo entre las presentaciones de S* fue de 2 minutos, en 20 minutos 
cuando fue de 4 minutos, en 54 minutos cuando fue de 8 minutos y en 
más de dos horas cuando fue de 16 minutos. Pero esta forma de pre- 
sentar los datos puede inducir a error. Cuando la fuerza del reflejo 
(en términos de la cantidad de secreción durante un minuto) se repre- 
senta gráficamente con respecto a las presentaciones del estímulo, las 
cuatro curvas son del mismo orden. 

Un reflejo extinguido puede recondicionarse restaurando la correla- 
ción entre S* y S!, Las curvas de extinción sucesivas tomadas después 
de magnitudes comparables de recondicionamiento muestran un des- 
censo de tasa progresivamente más rápido. Si un reflejo extinguido se 
deja inactivo durante unas cuatro horas, por ejemplo, su fuerza se in- 
crementa ligeramente gracias a lo que se llama recuperación espontá- 
nea. Estas diversas propiedades serán estudiadas de nuevo más tarde 
al comparar la extinción de una Operante, 

Pavlov ha interpretado la extinción como un caso de inhibición y 
ha presentado casos de lo que él llama “desinhibición” que parecen 
confirmar la naturaleza inhibitoria de la extinción, De acuerdo con el 
presente sistema, esta interpretación ts gratuita, y será considerada más 
adelante. 
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El condicionamiento tipo R 


El segundo tipo de condicionamiento, en que el estímulo reforzante 
se correlaciona con una respuesta, puede representarse como sigue: 


s. R0>8S.,R! 


en que s. R” constituye una parte de la conducta operante incondicio- 
nada del organismo y S! es, una vez más, un estímulo reforzante. Los 
requisitos del condicionamiento son una fuerza suficiente de S*.R' y 
la conexión indicada por->. El efecto es un cambio en (s. R“), que 
puede ser o bien un aumento o bien, posiblemente, una disminución. 
En el ejemplo presente de apretar una palanca la fuerza puede aumentar 
si S*, por ejemplo, es comida, y puede disminuir si, por ejemplo, es un 
shock.' Así pues, hay dos clases de estímulos reforzantes: positivos y 
negativos. La cesación de un reforzamiento positivo actáa como un 
reforzador negativo, la cesación de un negativo como un reforzador 
positivo. Las diferencias entre los dos tipos de condicionamiento serán 
resumidas más tarde. 


PROCEDIMIENTO EXPERIMENTAL 


La cadena de reflejos implicados en la pulsación de la palanca y 
en la obtención de comida se establece a través del condicionamiento 
tipo R. El orden en que se añaden los cuatro miembros principales ya 
se describió en el capítulo anterior. Ahora sólo voy a prestar atención 
directamente al eslabón de apretar la palanca. Una rata hambrienta 
incondicionada colocada en la caja experimental presentará una cierta 
fuerza débil de esta operante. Es decir, accionará la palanca unas cuan- 
tas veces durante una hora y a una tasa más bien irregular. Si la res- 
puesta ahora se correlaciona con el estímulo reforzante del sonido del 
almacén, la tasa aumentará de acuerdo con la presente ley. El dato 
requerido es la tasa a la cual tiene lugar el cambio de fuerza. 

Para obtener un reforzamiento máximo de la primera respuesta a 
la palanca, la respuesta discriminativa al sonido del almacén debe que- 
dar bien establecida. Se coloca a la rata en la caja experimental sin co- 
mida, y el almacén expulsa gránulos periódicamente. La rata llega a 
responder al comedero sólo cuando se ha oído el sonido del almacén, es 
decir, que discrimina entre el comedero solo y el comedero más el sonido 


1. Pero ver las secciones sobre reforzamiento negativo en este y el capítulo 
siguiente. 
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del almacén. El proceso es análogo a una discriminación descrita con de- 
talle en el capítulo 5. Por el momento puedo simplemente indicar que en 
el caso típico la rata llega a responder al comedero inmediatamente 
después del sónido, al cabo de diez presentaciones. En los experimen- 
tos siguientes se proporcionaron de esta forma de 50 a 200 gránulos 
con objeto de dar una considerable fuerza al reflejo. No he sido capaz 
de detectar ninguna diferencia en la tasa de condicionamiento de la 
respuesta a la palanca debida al número de esos reforzamientos del es- 
labón subsiguiente de la cadena, más allá, por supuesto, del número 
requerido para establecer la discriminación. Presumiblemente existe una 
relación, pero la tasa de condicionamiento es demasiado rápida para 
permitir la demostración de una diferencia significativa con el nú- 
mero de animales aquí empleados. 

Durante este entrenamiento preliminar la palanca puede estar co- 
locada en la caja (pero desconectada del almacén) y permitiendo re- 
gistrar las respuestas incondicionadas. O bien puede estar colocada 
pero fija, o puede estar ausente. La adaptación a la palanca como 
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Ficura 3 
CONDICIONAMIENTO ORIGINAL 


Se reforzaron todas las respuestas a la palanca. Los tres primeros reforzamientos 
fueron en apariencia ineficaces. Al cuarto siguió un rápido incremento de la tasa 


fuente de nueva estimulación, así como la adaptación a la respuesta 
real de apretar, seguramente influenciarán la tasa de condicionamiento, 
pero una vez más he sido incapaz de detectar alguna diferencia sig- 
nificativa. 

El día del condicionamiento la rata se pone en la caja como de cos- 
tumbre. La palanca está presente, y por primera vez en la historia de 
la rata su movimiento hacia abajo pondrá en funcionamiento el alma- 
cén. La figura 3 nos ofrece un registro del cambio de conducta resul- 
tante. En este caso, la palanca había estado pesente durante el entre- 
namiento preliminar pero se encontraba descansando en su punto más 
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bajo, por lo que no era posible ningún movimiento hacia abajo. El día 
del condicionamiento se produjo la primera respuesta cinco minutos 
después de soltar al animal. El reforzamiento no surtió un efecto ob- 
servable sobre la conducta. 51 minutos y medio más tarde se emitió 
una segunda respuesta, que también resultó sin efecto. 47 minutos y 
medio más tarde se produjo una tercera respuesta y 25 minutos tras 
ella una cuarta. A la cuarta respuesta siguió un apreciable aumento de 
la tasa mostrando una rápida aceleración hasta el punto máximo. Los 
intervalos que transcurrieron entre la quinta, la sexta, y las respues- 
tas siguientes fueron de 43, 21, 28, 10, 10 y 15 segundos respectiva- 
mente. A partir de este punto la rata respondió a una tasa esencialmente 
constante. Más tarde el gráfico muestra una aceleración negativa como 
consecuencia de un cambio de hambre debido a la ingestión de los 
gránulos (ver capítulo 9). 

Este ejemplo es poco corriente, ya que el condicionamiento no tie- 
ne lugar hasta el cuarto reforzamiento. En la figura 4 presentamos cin- 
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Ficura 4 
CONDICIONAMIENTO ORIGINAL 


Se reforzaron todas las respuestas. El cambio de tasa aquí ocurre más rápidamente 
que en la figura 3 


co registros que muestran un efecto más rápido, ejemplos en que el 
condicionamiento se produce al primer o segundo reforzamiento, aun- 
que la tasa no es inmediatamente máxima. En el caso óptimo, el primer 
reforzamiento produce un cambio completo y máximo, como muestran 
los cuatro registros de la figura 5. 
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Estas tres figuras nos proporcionan una representación bastante jus- 
ta del resultado obtenido con las 78 ratas sometidas a prueba con este 
método. Tres de esas ratas mostraron una tasa incondicionada muy 
baja de alrededor de una respuesta por hora. El condicionamiento no 
se produjo dentro del plazo de tres horas, por lo que no se llevó adelan- 
te ninguna experimentación posterior. De los restantes 75 registros el 
condicionamiento más lento viene mostrado en la figura 8. Veinte casos 
dieron el resultado instantáneo mostrado en la figura 5, y los restantes 
casos fueron semejantes a los de la figura 4. 

Creo que de la alta frecuencia de ocurrencia del cambio instantáneo 
se puede concluir que un solo reforzamiento es capaz de elevar la 
fuerza de la operante a un valor esencialmente máximo. Aparentemen- 
te, la única calificación del resultado experimental es el posible efecto 
de la fuerza incondicionada. Cuando todas las respuestas a la palanca 
son reforzadas, como en este procedimiento, la aparición de un cambio 
repentino de tasa es equívoco en lo que se refiere al efecto de un solo 
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FIGURA 5 
CONDICIONAMIENTO ORIGINAL 


RESPUESTAS 


El reforzamiento de todas las respuestas produce un cambio instantáneo a una tasa 
de respuesta prácticamente máxima 


reforzamiento. Si la tasa incondicionada es bastante alta, la segunda 
respuesta puede ser debida más a la fuerza incondicionada que al pri- 
mer reforzamiento. Como quiera que la segunda respuesta también es 
reforzada, la tasa máxima subsiguiente puede ser debida a ambos re- 
forzamientos. Pero los ejemplos de un cambio instantáneo ocurren 
demasiado frecuentemente como para ser explicados por las tasas in- 
condicionadas realmente observadas en los registros de control. Al me- 
nos en el 25 % de los casos, la segunda respuesta sigue a la primera tan 
rápidamente como cualquier respuesta posterior sigue a la precedente, 
pero ello difícilmente puede ser debido a una tasa incondicionada de 
respuesta de, por ejemplo, diez respuestas por hora. En breve describi- 
remos un procedimiento del que está ausente esta ambigúedad. 
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Por otra parte, la imposibilidad de obtener un cambio instantáneo, 
en todo caso puede explicarse de varias formas, como las siguientes: 

1) El hecho de que el reflejo correlacionado con el reforzamiento 
sea el segundo eslabón de una cadena significa que el primer eslabón 
—la respuesta de encaramarse y tocar la palanca— debe también re- 
forzarse por el sonido del almacén para obtener una tasa máxima. Pero 
esta respuesta puede haber sido emitida cierto tiempo antes de apretar 
y, como mostraré en el capítulo siguiente, un intervalo tan pequeño 
como dos segundos puede reducir el efecto de un reforzamiento en un 
tercio. En un cierto número de casos debemos suponer que la pulsación 
es reforzada, pero que el acto de tocar la palanca no lo es (al menos 
no tan extensamente). La rata debe tocar la palanca de nuevo antes 
que este eslabón inicial sea condicionado. Ya que los experimentos se 
realizan en la oscuridad, los estímulos discriminativos que controlan la 
respuesta no actúan coordinados con los estímulos directivos de la ex- 
ploración y por ello no son óptimos para un rápido condicionamiento. 

2) La respuesta de apretar la palanca se define como todo movi- 
miento que consiga que la palanca se desplace hacia abajo. Algunos 
casos pueden revestir una forma poco corriente. Por ejemplo, la rata 
puede mantenerse sobre sus patas traseras, perder el equilibrio y caer 
sobre la palanca. Los casos de este tipo son demasiado raros para afec- 
tar la tasa de respuesta después de que el condicionamiento haya teni- 
do lugar, pero debemos tenerlos en cuenta, especialmente antes de que 
se haya desarrollado una conducta particularmente fuerte. 

3) Si una rata es bastante activa, el sonido del almacén puede re- 
forzar otra conducta que precede inmediatamente a la pulsación. Si 
tal conducta tiene una mayor fuerza incondicionada, su fuerza total 
después del condicionamiento puede ser suficiente para causar un con- 
flicto significativo con la repetición de la forma precisa de respuesta 
que produce el reforzamiento. 

4) Cuando la palanca no ha estado presente antes del día del con- 
dicionamiento, su movimiento puede surtir un efecto emocional, uno 
de cuyos resultados puede ser la disminución de la tasa, 

5) Quizá el factor más importante que se interfiere en el cambio 
de tasa instantáneo sea la eliminación de los eslabones intermedios de 
la cadena. Según las condiciones del experimento, el simple encarama- 
miento y el contacto de la palanca son seguidos por el sonido del alma- 
cén cuando se aprieta la palanca. Pero los estímulos propioceptivos 
del acto de encaramarse y los estímulos exteroceptivos del contacto de 
la palanca se convierten así en estímulos discriminativos correlaciona- 
dos con la presencia de comida en el comedero. Es claramente observa- 
ble un efecto ocasional sobre la conducta. En los 78 casos aquí descritos, 
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las ratas no fueron observadas durante el proceso de condicionamien- 
to, ya que el aparato no permite la observación visual sin producir 
interferencia con los animales o al menos sin la estimulación perturba- 
dora adicional de una luz. Sin embargo, en unos pocos otros casos se 
observó el proceso dejando la caja abierta. (Ninguno de esos casos dio 
un condicionamiento instantáneo.) Después del primer reforzamiento 
se observó ocasionalmente que la rata tocó la palanca, tal vez la des- 
plazó ligeramente, y luego respondió al comedero sin producirse la 
pulsación y sin ser estimulada por el sonido del almacén. La respuesta 
a esta estimulación discriminativa parcial nunca se ve reforzada y por 
consiguiente se extingue (ver capítulo 5), pero surte un efecto sobre 
la tasa registrada en los primeros estadios del condicionamiento. En 
algunos de los presentes casos de un cambio no instantáneo podemos 
suponer que entre las respuestas registradas ocurrieron allí algunos ca- 
sos de provocación incompleta del eslabón inicial de la cadena. Que la es- 
timulación incidental de la respuesta a la palanca puede adquirir la 
misma función discriminativa que el sonido del almacén puede mos- 
trarse por la conducta de la rata cuando se desconecta el almacén des- 
pués de que haya ocurrido el condicionamiento. Una respuesta a la pa- 
lanca no es seguida por el sonido, pero, casi invariablemente, emite una 
respuesta al comedero. 


Aunque esos cinco factores operan para producir un cambio de tasa 
inferior al máximo, son todos ellos compatibles con la afirmación de 
la intensidad real del proceso. Afectan a la tasa observada, pero no a la 
tasa del condicionamiento. Sin embargo, no son plenamente respon- 
sables de la imposibilidad de obtener cambios instantáneos de tasa 
en todos los casos, tal como indica la conducta de la rata durante el 
recondicionamiento después de la extinción, que frecuentemente mues- 
tra cierta aceleración inicial a pesar del hecho de que la definición de 
la respuesta reforzada en tales casos debiera lograrse plenamente. Más 
adelante, en la figura 10, damos registros de recondicionamiento. En 
algunos de esos casos el cambio es instantáneo, no obstante, y creo que 
está justificada la conclusión de que un cambio instantáneo práctica- 
mente completo es muy común si no realmente típico del proceso de 
condicionamiento original. 

Puedo señalar que el resultado depende del desarrollo preliminar 
de los últimos reflejos de la cadena. Éste no puede obtenerse consisten- 
temente cuando el acto total de “apretar la palanca y de obtener la 
comida” se considera como una unidad y se trata experimentalmente 
como tal. Si no se da primero poder reforzante al sonido del almacén 
a través del establecimiento de una discriminación, transcurrirá un 
cierto intervalo de tiempo entre la respuesta y la estimulación de la 
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comida, y la efectividad del reforzamiento se verá reducida en gran 
parte. En raros casos puede observarse condicionamiento instantáneo, 
pero el resultado consistente obtenido en el presente caso no podrá ne- 
cesariamente obtenerse. 

La instantaneidad del condicionamiento tipo R tiene varias conse- 
cuencias interesantes. Cuando la demostración del condicionamiento 
se basa en un mero cambio de tasa en lugar de basarse en un cambio 
en la reserva del reflejo (que será discutido más tarde), es imposible 
responder las cuestiones referentes a: 1) la herencia de la facultad de 
adquirir una respuesta; 2) “la transferencia del entrenamiento” de una 
respuesta a otra; 3) el “ahorro” en el proceso de recondicionamiento, 
etcétera. No hay mejora posible en un cambio instantáneo. Es también 
probablemente imposible demostrar una clase especial de condiciona- 
miento llamada “aprendizaje intuitivo”. La intuición se ha definido de 
formas diversas y ha sido relacionada con diversas condiciones preli- 
minares del “problema” como la posibilidad de “percibir la relación de 
la respuesta con el reforzamiento”. La presencia real de la “intuición” 
por lo general sólo se mantiene cuando se emite una respuesta “acerta- 
da” y ésta se repite fácilmente. Es difícil ver cómo el presente caso 
pueda ser cualificado, aunque la única relación a “percibir” es la de 
la contigitidad temporal de la respuesta y el reforzamiento. En la crí- 
tica de la obra de Thorndike por parte de Kóhler se mantiene que esto 
es insuficiente (55). 

Más importante para nuestros fines presentes es la dificultad plan- 
teada al estudiar los efectos de las diversas condiciones del experimento. 
Ejemplos ya señalados son la adaptación anterior de la estimulación 
producida por la palanca, las respuestas anteriores de apretar la palan- 
ca y el grado en que se establece la respuesta discriminativa al sonido 
del almacén. En las gamas exploradas hasta ahora no se ha notado 
ningún efecto en la tasa de condicionamiento, pero si el proceso fuera 
más lento, es razonable suponer que se podría observar algún efecto. 
Otra variable, que será descrita en el capítulo 10, es la fuerza de S!. RI, 
que se observó que era importante para el condicionamiento tipo S. 

Una condición que era importante en el condicionamiento tipo S y 
que parece natural aplicar aquí es el tiempo que transcurre entre la 
respuesta (el estímulo en el tipo S) y el reforzamiento. Esta cuestión no 
ha sido investigada totalmente, pero podemos indicar los resultados 
siguientes: Se introduce un intervalo permitiendo que el contacto sobre 
la palanca accione un mecanismo de relojería que opere el almacén al 
final del intervalo deseado. Con un grupo de ocho ratas, de esta forma 
se introdujeron intervalos de 1, 2, 3 y 4 segundos. En la figura 6 pre- 
sentamos las curvas resultantes. Las tasas de aceleración son todas com- 
parables con las obtenidas con el reforzamiento simultáneo con la po- 
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sible excepción de un caso de dos segundos. La ligera irregularidad en 
las tasas alcanzadas finalmente a los tres o cuatro segundos se debe al 
hecho de que tan pronto como el reflejo ha adquirido cierta fuerza 
puede ocurrir una segunda respuesta durante el intervalo antes del re- 
forzamiento. Un nuevo intervalo debe empezar en este punto o la se- 
gunda respuesta será reforzada demasiado rápidamente, pero esto signi- 
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CONDICIONAMIENTO ORIGINAL CON REFORZAMIENTO RETARDADO 


Se introdujeron los intervalos de tiempo señalados en los gráficos entre la respuesta 
y la administración de la comida 


fica que la primera respuesta debe resultar no reforzada. Con los 
intervalos más largos este resultado se ve gravemente perturbado. He 
sido capaz de condicionar la respuesta con un intervalo de hasta 8 se- 
gundos, pero en vista de la inclusión de las respuestas no reforzadas, es 
difícil decir si la aceleración se ve realmente retardada o no. 


LA EXTINCIÓN TIPO R 


La extinción de un reflejo condicionado tipo R se produce cuando 
el estímulo reforzante deja de seguir a la respuesta. El cambio es sim- 
plemente un descenso de (s.R), cuyo curso viene indicado por el ex- 
perimento siguiente: Se condicionaron cuatro ratas de la forma antes 
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descrita y en cada caso se reforzaron unas 100 respuestas. Al día si- 
guiente se desconectaron los almacenes de forma tal que el movimiento 
de la palanca no surtiera efecto, excepto sobre los dispositivos de re- 
gistro. Se colocaron las ratas en las cajas experimentales y se soltaron 
en el momento y de la forma acostumbrada. Sus respuestas a la palanca 
durante la hora siguiente vienen representadas en la figura 7. Se sol- 
taron a los animales aproximadamente al principio de las curvas, ex- 
cepto a la rata D. En este experimento se utilizó una puerta de acceso 
que era abierta por la propia rata, y la rata D mostró un característico 
retraso. Su registro se inicia unos cinco minutos después de la apertura 
de la puerta. 

Cuando la primera respuesta a la palanca deja de suministrar el 
estímulo para el próximo eslabón de la cadena usual, se provoca de 
nuevo inmediatamente la respuesta, y se mantiene una tasa alta de pro- 
vocación durante un breve período. Ésta pronto se ve interrumpida 
y posteriormente la tasa sufre una extensa fluctuación. A pesar de la 
irregularidad, es posible indicar el curso general de cada curva. Cuando 
se actúa de esta forma, como en la figura 7, es evidente que las desvia- 
ciones tienen el carácter de depresiones en la curva y que son seguidas 
por incrementos compensatorios de tasa. A causa de la compensación, 
al final se logra una curva suave bastante aproximada. 

Estas curvas son típicas. Se podrían haber dado mejores aproxima- 
ciones a una curva suave, pero hubiesen representado menos exactamen- 
te lo que hace un animal medio. Las curvas generalmente presentan 
acusadas desviaciones, que deben aceptarse como características del 
cambio de fuerza observado bajo estas condiciones. Sin embargo, las 
desviaciones no son debidas al azar. Los intervalos que transcurren 
entre las respuestas sucesivas no se distribuyen en modo alguno al azar, 
y las fluctuaciones observadas, en este sentido, son reales. Antes de 
proceder a dar una explicación de su naturaleza, no estará de más con- 
siderar ciertas fuentes posibles de trastorno en las curvas registradas y 
ciertos cambios incidentales en la conducta de la rata, que deben tomar- 
se en cuenta a la hora de determinar el curso del proceso principal. En 
primer lugar, es posible que el carácter de la respuesta cambie durante 
la extinción, de tal forma que el cierre del interruptor de mercurio si- 
tuado en la palanca ya no sirva de criterio fiable de la conducta. Pero 
ello evidentemente no es cierto. A lo largo del curso de la extinción 
los contactos en general son claros y precisos y su duración se mantiene 
de forma bastante exacta en un valor medio constante. Otra posibilidad 
es que hacia el fin de dicha curva puedan aparecer respuestas que son 
debidas a la fuerza incondicionada, o sea las respuestas “exploratorias” 
que se hubiesen emitido durante la hora aun en el caso de que no hu- 
biera tenido lugar ningún condicionamiento. Pero el número de tales 
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respuestas después del primer o segundo día no es digno de tenerse 
en cuenta. 

La única clase importante de irregularidad es característica de la 
conducta de la rata salvo cuando el reflejo se halla en su fuerza máxi- 
ma. Bajo las circunstancias que producen una tasa de respuesta cons- 
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FIGURA 7 


CUATRO CURVAS DE EXTINCIÓN TÍPICAS 
Ninguna respuesta fue reforzada 


tante, pero inferior a la máxima, los intervalos que tienen lugar entre 
las respuestas sucesivas varían. Un resultante es la tasa constante. El 
registro real puede mostrar breves períodos de no-respuesta seguidos 
por un aumento compensatorio de actividad, y durante la extinción 
(pero muy raramente en otros casos), puede producirse un incremento 
de tasa seguido por una depresión. El primer caso se atribuye razona- 
blemente a la acción prepotente de la estimulación incidental en la 
caja experimental. El segundo puede deberse a un efecto emocional 
(ver capítulo 11). En registros posteriores podremos apreciar muchos 
ejemplos de desviaciones con compensación. 

De un examen superficial de la figura 7 se deduce claramente que 
la curva típica de la extinción es de carácter ondulado. No se da una 
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longitud de onda o una amplitud muy uniforme, pero la tasa de pro- 
vocación claramente tiende a pasar de un valor alto a un valor bajo y 
este proceso se repite. Las transiciones a veces se producen de forma 
fluida, pero con más frecuencia son bruscas. Ya que un efecto de este 
tipo es al parecer continuo, podemos considerar la transición fluida 
como representativa del cambio real de fuerza y explicar las transicio- 
nes bruscas a base de los factores perturbadores ya mencionados. El 
curso probable del cambio de fuerza en las cuatro curvas de la figu- 
ra 7, diferenciado del curso perturbado encontrado experimentalmente, 
viene representado en la figura 8. Más tarde pondremos ejemplos que 
mostrarán más claramente el carácter cíclico de las curvas. 

Una explicación teórica simple de esta fluctuación cíclica puede 
deducirse del supuesto de que una interrupción de la cadena normal 
de reflejos ingestivos establece un efecto emocional que disminuye la 
tasa de provocación. La incapacidad de reforzar es una operación emo- 
cional común como ya hemos señalado en el capítulo 1. Para explicar 
las presentes observaciones debemos presumir la existencia de un des- 
fase temporal en lo que se refiere al efecto y debemos recurrir también 
a un incremento compensatorio de tasa. En el proceso de extinción la 
tasa de provocación empieza en su punto máximo. Bajo las condiciones 
del experimento cada respuesta permanece sin reforzar y se genera un 
efecto emocional. Sobreviene un período de tasa reducida, durante el 
cual el efecto previamente generado desaparece y (debido a la tasa 
reducida) no es, en gran medida, reemplazado. Gracias a un aumento 
compensatorio la tasa vuelve a un valor casi máximo, punto en que 
entra en un segundo ciclo. Las propiedades de la curva resultante 
dependerán del grado del efecto depresor de una sola provocación inte- 
rrumpida, del desfase temporal y de la naturaleza del proceso de resta- 
blecimiento. Una característica de dicho efecto es que se adapta fácil- 
mente, y se pueden obtener curvas de extinción que no presenten este 
efecto cíclico cuando se dispone de tiempo para la adaptación (ver el 
capítulo siguiente). 

En la figura 8 podemos examinar más fácilmente las curvas teóricas 
que se han ajustado a los datos. Son logarítmicas y están trazadas de 
forma envolvente, partiendo del supuesto de que las desviaciones cons- 
tituyen depresiones. La anterior explicación de la fluctuación se basa 
en dicho supuesto, ya que requiere la existencia de un efecto compen- 
satorio. Además, la primera sección corta cobra mayor importancia en 
cada registro, permitiendo que las curvas teóricas discurran bastante 
por encima de las secciones de las curvas inmediatamente siguientes. 
Ello también se justifica por la presente interpretación de la fluctua- 
ción. Como quiera que hemos supuesto la existencia de un desfase tem- 
poral, la primera parte de la curva debe de estar libre del efecto de- 
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presor. Por lo demás, no hay razón para esperar que los primeros res- 
tablecimientos de las depresiones logren alcanzar la curva extrapolada, 
ya que la generación de un efecto depresor no está relacionada en ab- 
soluto con el hecho de si la rata se encuentra “sometida a programa” o 
no. Finalmente, se alcanza la curva teórica, porque el efecto emocional 
se adapta parcialmente y porque la curva entretanto ha sufrido un des- 
censo. 

Sin duda alguna, otros tipos de curvas pueden ajustarse, asimismo, 
a esos datos. No se precisa necesariamente una curva logarítmica, pero 


Ficura 8 
CURSO INFERIDO DE LOS REGISTROS DE LA FIGURA 7 
Se han tenido en cuenta las irregularidades previstas 


puede usarse como una simple descripción empírica. Quizás en el mo- 
mento presente es imposible establecer la naturaleza exacta del cambio 
de forma más precisa. A causa de la fluctuación cíclica y de su longi- 
tud de onda variable es inútil recurrir a los promedios. Si la interpreta- 
ción presente es correcta, todas las desviaciones se producen en una 
misma dirección. Promediando un gran número de casos seguramente 
se podría obtener uma curva suave, pero ésta no representaría la en- 
volvente a la que se aproxima cada curva separadamente. 

La presente interpretación de la extinción puede resumirse como 
sigue: 

1) La disminución de la fuerza del reflejo observada durante el 
proceso de la extinción sigue un curso aproximadamente logarítmico. 
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2) La condición esencial de la extinción (la interrupción de la cade- 
na) ocasiona también un cambio temporal (emocional), que hace dis- 
minuir la tasa de provocación. 

3) El efecto depresivo muestra un desfase temporal, que en con- 
junción con un aumento compensatorio de tasa produce una fluctuación 
cíclica. 

4) El efecto depresivo está sujeto a la adaptación. 


RECUPERACIÓN ESPONTANEA DE LA EXTINCIÓN 


Al final del período experimental representado en la figura 7 se 
alcanza una tasa baja de provocación. La fuerza del reflejo se reduce 
aproximadamente a su valor de antes del condicionamiento. Pero si 
algún tiempo después se vuelve a colocar a la rata en la caja (sin que 
haya tenido lugar ningún tipo de condicionamiento), se obtendrá una 
pequeña curva de extinción. Se ha producido una pérdida del grado 
de extinción. En la figura 9 reproducimos una de las curvas de la fi- 
gura 7 con una curva posterior obtenida 48 horas más tarde. Para evitar 
cualquier efecto producido por el cambio del procedimiento diario se 
colocó a la rata en la caja experimental como de costumbre el día in- 


100 


l 2 


RESPUESTAS 


PERÍODOS DIARIOS DE UNA HORA CADA UNO 


FIGURA 9 
RECUPERACIÓN ESPONTÁNEA DE LA EXTINCIÓN 
La primera curva procede de la figura 7. La segunda se obtuvo de la misma rata 
cuarenta y siete horas más tarde sin ningún condicionamiento intermedio 


termedio, pero se le administró comida sin necesidad de tener que 
emitir respuestas a la palanca. Así no hubo reforzamiento (o más ex- 
tinción) del reflejo entre los dos registros. Sin embargo, el segundo día 
de la extinción la tasa empieza con un valor muy superior al valor 
final del primer día. El registro muestra una recuperación bastante 
mayor que la generalmente observada después de veinticuatro horas, 
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pero el orden de magnitud es el mismo y el carácter de la curva, típico.* 
Este efecto al final desaparece si la extinción es suficientemente pro- 
longada y es probable que se alcance un estado de extinción completa. 
Dado que el reflejo pueda persistir con cierta fuerza incondicionada a 
pesar de la extinción, nos limitamos al enunciado de que la frecuencia 
de la provocación queda reducida aproximadamente a su valor anterior 
al condicionamiento. 


RECONDICIONAMIENTO 


El recondicionamiento después de la extinción se efectúa restauran- 
do la correlación entre R* y S*, Toda vez que no hay efecto comparable 
con una “extinción por debajo del punto cero” en el caso de una ope- 
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Ficura 10 
RECONDICIONAMIENTO DESPUÉS DE LA EXTINCIÓN 


Los registros empiezan con curvas de extinción en un estadio avanzado. Se refor- 
zaron todas las respuestas después de las líneas verticales 


rante, el recondicionamiento debiera parecerse al condicionamiento ori- 
ginal bajo todos los aspectos, si exceptuamos el hecho de que debe 
faltar toda modificación debida a la definición topográfica de la res- 
puesta. Esta expectativa se ve corroborada por los datos. Las curvas 
de recondicionamiento, según mi propia experiencia se parecen extraor- 
dinariamente a las curvas del condicionamiento original. La figura 10 


1. Joutz (J. Exper. Psych.) ha encontrado que las curvas de la segunda extinción 
llevadas a un cero arbitrario, muestran una recuperación espontánea del 28% 
al 58% de la curva original de extinción. 
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(pág. 96) da dos ejemplos obtenidos tras una extinción prolongada que 
tuvo lugar después de un procedimiento de recondicionamiento perió- 
dico que será descrito en el capítulo siguiente. Se conectaron los alma- 
cenes en las líneas verticales y empezó el recondicionamiento a la res- 
puesta siguiente. Puede observarse una ligera aceleración positiva que 
se asemeja a la aceleración que se obtiene a menudo en el condiciona- 
miento original. 

Evidentemente, un reflejo recondicionado puede extinguirse de nue- 
vo. En la figura 11 se había extinguido el reflejo completamente el día 
anterior. En la pequeña curva del punto A observamos una cierta pér- 
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Ficura 116 
RECONDICIONAMIENTO Y EXTINCIÓN SUBSIGUIENTE 


En A: cierto restablecimiento de la extinción. En B: diez respuestas reforzadas. 
En C: sigue la extinción 


dida de la extinción. Entonces la tasa alcanzó un valor muy bajo. En 
el punto B se reforzaron 10 respuestas. Es evidente una aceleración 
positiva en la curva de recondicionamiento. Entonces se omitió el refor- 
zamiento y en el punto C se produce la extinción resultante. Se ha aña- 
dido una línea de base para la curva de extinción. Como quiera que 
se trata de una segunda curva de extinción, el efecto emocional que pro- 
duce una fluctuación cíclica se ha adaptado en gran medida. Todavía 
hay cierta fluctuación, empero, y los efectos de las desviaciones me- 
nores pueden observarse de nuevo. El área abarcada por la curva de 
este registro es excepcionalmente grande para el reforzamiento de sólo 
diez respuestas, 

La figura 12 muestra que ese incremento de fuerza constituye en 
realidad un recondicionamiento y no simplemente un efecto facilitati- 
vo debido a la obtención de comida. En este experimento el reflejo se 
había extinguido por completo. Hay una ligera pérdida de la extinción 
evidente al principio de la curva, seguida sólo por dos respuestas du- 
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rante los próximos 25 minutos. Entonces se administraron por el ex- 
perimentador tres gránulos de comida del almacén, permaneciendo 
desconectada la palanca. 

La rata apretó la palanca sólo cinco veces en los 18 minutos siguien- 
tes, lo que indica que el efecto facilitativo, si es que estaba presente, 
era muy débil. En la próxima respuesta se conectó el almacén y la 
rata obtuvo tres gránulos de comida, apretando una vez la palanca para 


FicuRA 12 $ 


CONTROL DE LA POSIBLE ACCIÓN FACILITADORA DE UN ESTÍMULO REFORZANTE 


El registro empieza con una extinción en estado avanzado. Un poco antes de la 
primera línea horizontal se le dieron tres gránulos de comida sin respuestas. Poco 
antes de la segunda línea se reforzaron tres respuestas 


obtener cada uno de ellos. Entonces se desconectó el almacén y se 
obtuvo una significativa curva de extinción. 


CONDICIONAMIENTO SECUNDARIO 


Pavlov ha descrito un proceso de condicionamiento secundario 
(tipo S) en el que un estímulo adquiere las propiedades de un estímulo 
condicionado como resultado de acompañar a un estímulo previamen- 
te condicionado en ocasiones en que no existe ningún reforzamiento in- 
condicionado final. Por ejemplo, un cuadrado negro presentado a un 
perro durante 10 segundos es seguido 15 segundos más tarde por el 
sonido de un metrónomo, estímulo condicionado de un reflejo salivar. 
Tras diez presentaciones (sin ningún reforzamiento) el cuadrado provo- 
ca una pequeña respuesta salivar. Este procedimiento es idéntico al 
del establecimiento de una discriminación, en la que el nuevo estímulo 
debe adquirir propiedades “inhibitorias” en lugar de “excitantes” (para 
usar la terminología de Pavlov). Según Pavlov, el diferente resultado 
depende de la estipulación de que en el condicionamiento secundario el 
nuevo estímulo debe retirarse pocos segundos después de la aplicación 
del estímulo condicionado. Este orden temporal poco usual limita grave- 
mente la aplicación del resultado a la conducta normal y, como trataré 
de mostrar en el capítulo 6, la noción entera de condicionamiento se- 
cundario tipo S es probablemente dudosa. 

Sin embargo, hay un proceso que pudiera muy bien llamarse con- 
dicionamiento secundario tipo R. No implica un conflicto con el pro- 
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ceso de discriminación porque lo que se refuerza es más uma respuesta 
que un estímulo. El proceso consiste en añadir un eslabón inicial a 
una cadena de reflejos sin reforzar, en última instancia, la cadena. En 
el ejemplo presente, el sonido del almacén adquiere un valor reforzante 
gracias a su correlación con el reforzamiento último. Puede funcionar 
como un agente reforzante aun cuando este reforzamiento final esté 
ausente. Su poder reforzante será debilitado mediante la extinción re- 
sultante, pero puede efectuarse un considerable condicionamiento antes 
de que se alcance un estado de extinción más o menos completo. En 
el experimento siguiente mostramos el resultado máximo que se obten- 
dría a partir de una cantidad dada del condicionamiento previo del 
sonido del almacén. 

El procedimiento usual preliminar se aplicó a cuatro ratas, que 
gracias a dicho procedimiento empezaron a responder fácilmente al 
sonido del almacén al acercarse al comedero. Se procedió a sesenta pre- 
sentaciones conjuntas de sonido y de comida. El día del condiciona- 
miento el almacén fue conectado a la palanca, pero estaba vacío. Por 
primera vez en la historia de la rata el movimiento de la palanca pro- 
dujo el (hasta entonces siempre reforzado) sonido del almacén, pero 
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Ficura 13 
CONDICIONAMIENTO ORIGINAL SIN REFORZAMIENTO FINAL 


No se había reforzado nunca ninguna respuesta antes de este día, así como tampoco 
se reforzó ninguna durante el período representado. Pero después del sonido del 
almacén se había producido previamente la administración de comida y aquí ejerce 
un considerable efecto reforzante aun cuando no se administre comida en absoluto 
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finalmente no se reforzó ninguna respuesta con comida. En la figura 13 
damos las cuatro curvas resultantes. El sonido del almacén sirve para 
reforzar la respuesta a la palanca de tal forma que se emiten un con- 
siderable número de respuestas. Las alturas de las curvas son del mis- 
mo orden que las de la extinción después de una cantidad comparable 
de reforzamiento previo, pero el reforzamiento no es bastante efectivo 
para formar una tasa máxima inicial tal como se observa durante la 
extinción. Los registros pueden considerarse como curvas de extinción 
aplanadas. En la tercera curva de la figura se produce un período de 
respuesta relativamente rápida, pero ello constituye claramente un in- 


cremento compensatorio de tasa después de un período de respuesta 
escasa o nula. 


El condicionamiento y la reserva del reflejo 


Al estudiar la noción de reserva del reflejo en el capítulo 1, usamos 
como ejemplo la curva de extinción tipo R. Consideramis que el pro- 
ceso de condicionamiento creaba una serie de respuestas potenciales, 
que podían producirse más tarde sin reforzamiento. Durante la extinción 
esta reserva se agota. Podemos suponer que en cualquier punto la tasa 
de respuesta es más o menos proporcional a la reserva existente. Al 
principio de la extinción tanto la reserva como la tasa son máximas. A 
medida que se van produciendo respuestas la reserva va disminuyendo 
y la tasa desciende. La pendiente de la envolvente de la curva de ex- 


RESPUESTAS 


TIEMPO EN MINUTOS 
Ficura 14 


RECUPERACIÓN ESPONTÁNEA Y LA EXTRAPOLACIÓN DE UNA CURVA DE EXTINCIÓN 


Un caso teórico para ilustrar la relación de al curva de recuperación con la 
envolvente de la curva de extinción 


tinción da la tasa máxima de emisión en cualquier punto. Las desvia- 
ciones significativas están por debajo de esta envoltura y sugieren que 
los factores incidentales pueden cambiar la proporcionalidad en el sen- 
tido de reducir la tasa. 

El fenómeno de la recuperación espontánea no altera el supuesto 
de una relación entre la tasa y la reserva. La envolvente no se ve so- 
brepasada. Si se hubiera continuado la extinción durante el tiempo re- 
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querido para la recuperación, la curva hubiese sido bastante alta como 
para cubrir la nueva curva y probablemente mucho másá alta. La re- 
cuperación espontánea simplemente indica que algunas de las respuestas 
que hubieran ocurrido durante el período intermedio, se han hecho 
inmediatamente accesibles tan pronto como se ha presentado la opor- 
tunidad de la provocación. En la figura 14 he extrapolado una curva 
típica a lo largo de diez horas (he omitido del gráfico las horas 3 a 8 
inclusives) y he indicado el lugar de una segunda curva de extinción 
que mostrará la recuperación espontánea. La segunda curva empieza 
en la altura en que la primera se detuvo, y continúa muy por debajo 
de la envolvente proyectada de la primera. No hay razón para esperar 
que la envolvente sea alcanzada, ya que describe el proceso de una 
emisión no obstaculizada. 


Los rápidos aumentos compensatorios de tasa después de los perió- 
dos de actividad escasa o nula durante la extinción difieren de la re- 
cuperación espontánea en cuanto a que el factor responsable de la 
inactividad no es la ausencia de los estímulos discriminativos externos 
necesarios, sino la actividad prepotente de estímulos en conflicto o bien 
un efecto emocional. En el caso de la compensación, aparentemente 
todas las respuestas que hubieran ocurrido en caso de mantenerse la 
actividad, se encuentran disponibles cuando se reanuda la respuesta. 
Si ello no es cierto, las fluctuaciones cíclicas típicas de la extinción ori- 
ginal hacen descender permanentemente la curva por debajo de la ex- 
trapolación de su primera parte. Los ejemplos disponibles de curvas de 
extinción son demasiado irregulares para establecer el hecho de una 
plena compensación, pero parece probable que la envolvente en muchos 
casos se llega a alcanzar o casi. La diferencia existente entre la com- 
pensación y el restablecimiento puede ser debida tanto a los breves 
intervalos en el caso de la primera como a los factores causantes de la 
inactividad. 

El fenómeno de la comprensación, como el de la recuperación, exi- 
ge la noción de una reserva inmediata distinta de la reserva total que 
determina la tasa si no existe interrupción. El proceso es catenario. La 
tasa es proporcional a la reserva inmediata, que es alimentada por la re- 
serva total. Cuando la provocación es continua, la reserva total controla 
el proceso. Cuando se interrumpe la provocación, se constituye la reser- 
va inmediata, y así se posibilita un período de actividad incrementada 
cuando se reanuda la respuesta, hasta que la reserva total se convierte 
de nuevo en el factor de control. El período de tiempo durante el cual 
la respuesta puede suspenderse sin hacer que la envolvente original 
sea inaccesible dependerá del volumen de la reserva inmediata. 
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No creo que los datos disponibles en este momento sean adecuados 
para sostener una formulación matemática de un sistema tal, y por ello 
voy a dejar la cuestión en este estadio cualitativo. Más adelante expon- 
dremos una gran cantidad de material relativo a la noción de reserva. 


EL CONDICIONAMIENTO COMO CREACIÓN 
DE UNA RESERVA 


La definición de condicionamiento que hemos dado aquí está for- 
mulada en términos de un cambio de la fuerza del reflejo, pero el acto 
del reforzamiento tiene otro efecto distinguible. Establece la potencia- 
lidad de una curva de extinción subsiguiente, cuyo tamaño constituye 
una medida del grado de condicionamiento alcanzado. No hay una re- 
lación simple entre esas dos medidas. Es posible alcanzar una tasa má- 
xima de respuesta (una fuerza máxima) muy rápidamente. El reforza- 
miento posterior no afecta a esta medida, pero continúa formando la 
reserva descrita por una curva de extinción subsiguiente. El efecto tí- 
pico del “sobrecondicionamiento” no se refleja sobre alguna propiedad 
inmediata de la conducta, sino sobre sus cambios subsiguientes durante 
la extinción. (La ausencia de una relación entre las dos medidas no es 
incompatible con el supuesto de una relación entre la tasa y la reserva 
a causa de la interposición de la reserva “inmediata” limitada.) 

En cuanto alcanzan mis conocimientos, todas las técnicas usuales 
para el estudio del condicionamiento se refieren solamente al cambio 
de fuerza, tal vez porque constituye el dato inmediatamente observa- 
ble. La medida es insuficiente no sólo porque deja de funcionar cuando 
el reforzamiento sigue surtiendo un efecto, sino porque presenta di- 
ficultades técnicas. Para medir la fuerza de un reflejo debemos provo- 
carlo, y si es un reflejo condicionado, la provocación debe ser reforzada 
O no reforzada. En ambos casos se produce un efecto sobre el estado del 
reflejo, que altera la condición que se mide. Se trata de un dilema ine- 
vitable, cuyas consecuencias serán más o menos graves según el método 
empleado y la importancia relativa del efecto de una sola provocación. 
Ya hemos señalado un ejemplo en la prueba de un cambio instantáneo 
de fuerza debido a un solo reforzamiento. La segunda respuesta debe 
ser reforzada o no, y en ambos casos la fuerza se ve afectada. La única 
“tasa” disponible viene dada por el intervalo entre las dos primeras 
respuestas, puesto que la segunda provocación aporta por sí misma un 
nuevo efecto condicionante. Necesitamos una demostración estadística 
de que este intervalo es más corto del que se observaría si la primera 
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respuesta no fuera reforzada. Un solo experimento no píede ser con- 
vincente. Aunque se observó un porcentaje suficiente de casos para ha- 
cer muy probable un cambio instantáneo, el recurso a una serie de casos 
no es afortunado, ya que la cantidad de condicionamiento realmente 
observado después de una provocación varía enormemente según los 
casos, y al hacer el promedio de un grupo de primeros intervalos inevi- 
tablemente disimulamos los ejemplos excepcionales, que son de espe- 
cial interés. Además, aunque una demostración estadística en el pre- 
sente caso muestre que el condicionamiento puede establecerse con una 
sola provocación, nos enfrentamos con la falta de fiabilidad comparati- 
va de un solo intervalo como medida del grado del cambio. 

El método alternativo consiste en examinar la reserva creada por 
un solo reforzamiento. El procedimiento es simple. La primera respues- 
ta es reforzada como de costumbre, y luego el almacén se desconecta 
permanentemente. Si tiene lugar el condicionamiento, se obtiene una 
curva de extinción, cuya altura constituye una medida del grado de 
condicionamiento. 

Un experimento que demuestra la considerable cantidad de condi- 
cionamiento a partir del reforzamiento de una sola respuesta viene re- 
presentado en la figura 15. En los experimentos de este tipo es nece- 
sario (por razones que explicaremos en breve) tomar registros de control 
de la respuesta incondicionada después del entrenamiento preliminar al 
sonido del almacén. En la figura 15 el registro A es un control tomado 
antes del entrenamiento preliminar. La rata estaba hambrienta y no ha- 
bía comida disponible. 


RESPUESTAS 


Pis 


TIEMPO 1 HORA 


Ficura 1510 
CURVA DE EXTINCIÓN DESPUES DEL REFORZAMIENTO DE UNA SOLA RESPUESTA 


La primera respuesta de la curva C fue la única respuesta de la historia del orga- 
nismo que fue reforzada 
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La agrupación de respuestas en la primera parte de este registro 
es, probablemente, debida al hecho de que cuando la rata responde a 
la palanca, se halla en una posición óptima para responder de nuevo. 
El reflejo se adapta de forma bastante completa antes del fin de la 
hora. El registro B es un control de las respuestas exploratorias en ausen- 
cia de comida después del entrenamiento al sonido del almacén. Su 
importancia aparecerá más tarde. El registro C fue tomado al día si- 
guiente. La primera respuesta se produjo al cabo de unos 20 minutos. 
Fue triplemente reforzada. Es decir, simultáneamente con la respuesta 
se descargó un gránulo de comida y al cabo de tres segundos se descar- 
garon por el experimentador dos gránulos más. Aunque la rata recibió 
tres gránulos de comida, sólo se reforzó una respuesta. Gracias al regis- 
tro podemos ver que la rata empezó a responder de nuevo inmediata- 
mente y que durante los 40 minutos restantes trazó una curva de ex- 
tinción típica. Nos vemos obligados a concluir que es éste el efecto del 
reforzamiento de una respuesta. 

El registro tiene las propiedades generales de la extinción original. 
Puede trazarse una envolvente logarítmica por encima de la curva (la 
línea quebrada responde a la ecuación N =K log t, en la que N es el 
número de respuestas en el tiempo £ y K es una constante), aunque los 
contactos reales con la curva experimental no constituyen ninguna jus- 
tificación para dicha forma en este caso particular. La curva experi- 
mental sufre una desviación cíclica por debajo de la envolvente, que 
constituye una demostración excepcionalmente buena del carácter on- 
dulado, antes inferido de registros mucho menos regulares. La curva 
difiere en un aspecto de las obtenidas después de un condicionamiento 
más extenso: carece del arranque inicial de respuestas que discurre 
por encima de la curva teórica. Para ajustar la figura 15 de esta forma 
sería necesario trasladar el origen de la curva teórica casi un minuto 
hacia la derecha. Esto puede indicar un desfase en el efecto del con- 
dicionamiento. 

El resultado no es siempre tan claro. En quizá la mayoría de los 
casos la línea de control B es incapaz de mantener la pendiente espe- 
rada desde A. El entrenamiento al sonido del almacén produce un in- 
cremento de la tasa de respuesta observada que es independiente de 
cualquier reforzamiento real del almacén. Aparece una nueva línea 
de base de la que la primera parte del registro de la figura 16 constituye 
un ejemplo. Aunque no haya tenido lugar todavía ningún reforzamiento 
producido por el almacén, es evidente una significativa tasa de provo- 
cación. La explicación probable es la siguiente. En el entrenamiento 
preliminar al almacén se establece una discriminación. La rata llega 
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a responder fuertemente al comedero-más-el-sonido-del-almacén, pero 
no a responder al comedero solo. Puede mostrarse fácilmente que esta 
discriminación es, a menudo, ampliamente generalizada (ver capítulo 5). 
La rata responderá al comedero si éste va acompañado de casi cualquier 
tipo de estimulación extra. Ahora bien, aun cuando el almacén perma- 
nezca desconectado, una respuesta a la palanca estimulará a la rata 
de muchas formas, y esta estimulación —auditiva, táctil y cinestética— 
puede ser suficiente para provocar la respuesta discriminatoria al co- 
medero. Aunque no se reciba ningún gránulo y la secuencia de reflejos 
no sea, por tanto, reforzada finalmente, la respuesta a la palanca y la 
respuesta discriminatoria al comedero están presentes, y se producirá 
un cierto condicionamiento de la primera de ellas. La línea de base 


RESPUESTAS 


TIEMPO 


Ficura 161 
CURVA DE EXTINCIÓN DEL REFORZAMIENTO DE UNA SOLA RESPUESTA 


En este caso se producen algunas respuestas sin reforzamiento específico. En la 
flecha se reforzó una respuesta 


tiene la forma general de la curva obtenida en la extinción secundaria 
descrita antes en la figura 13, página 99, pero presenta menos condi- 
cionamiento. 

Cuando tiene lugar esta generalización, la curva de extinción debe 
observarse con respecto a la nueva línea de base. En la flecha de la 
figura 16 se reforzó una sola respuesta a la palanca con un gránulo de 
comida. Tras una corta pausa se inició la curva de extinción. Suponien- 
do que la línea de base sea aproximadamente lineal, podemos sustraerla 
de la curva experimental. La curva punteada de la figura 16 responde 
a la ecuación anterior con casi el mismo valor de K. La línea quebrada 
responde a la misma ecuación más ct en el lado derecho, en que c es 
otra constante determinada a partir de la línea de base. La figura así 
obtenida se puede comparar muy bien con la figura 15, aunque la for- 
ma ondulada se refleja mucho menos suavemente. La figura 16 también 
carece del arranque inicial. El cambio de origen requerido en este caso 
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sería de casi dos minutos. (Debe tenerse en cuenta que la curva de ex- 
tinción empieza en la primera respuesta no reforzada y no en la flecha.) 

En el caso de la figura 15 el registro B constituye un control ade- 
cuado para evitar un cambio de línea de base. La generalización de la 
discriminación no se ha producido, y el registro C no puede conside- 
rarse como si incluyera una línea de base de cualquier pendiente signi- 
ficativa. La curva es debida totalmente al reforzamiento de la primera 
respuesta y el reforzamiento parcial de otras respuestas no interviene 
para nada en ella. Este es, obviamente, el resultado más simple. y de- 
beríamos idear algún medio para obtenerlo regularmente. Aunque no 
existe una dificultad insuperable para explicar el efecto de la generaliza- 
ción, en ciertos aspectos se puede poner objeciones. El condicionamiento 
que ocurre en la flecha de la figura 16, por ejemplo, no es condiciona- 
miento original si esta interpretación de la línea de base precedente es 
correcta, pues la estimulación general resultante de las respuestas an- 
teriores ha surtido un efecto reforzante. 

Es evidente que la curva de extinción proporciona información más 
clara sobre el cambio que ocurre en el reforzamiento que el mero incre- 
mento de tasa al que recurríamos en la primera parte de este capítulo. 
Si algún aspecto de la curva (su altura o área) se toma como una medi- 
da apropiada de la cantidad de condicionamiento, en el tipo presente de 
experimento, con un solo reforzamiento, la cantidad varía considera- 
blemente según las ratas. Las curvas de las figuras 15 y 16 son algo su- 
periores a la media, aunque no son en absoluto excepcionales. En raros 
casos no puede mostrarse ningún efecto. Los “buenos” registros, desde 
luego, no pueden ser accidentales. Por otra parte, ya he expuesto las 
diversas razones por las que un primer reforzamiento no puede ser ple- 
namente efectivo. Estas fuentes de variabilidad parecen por el momento 
estar más allá del control experimental. 


EL VOLUMEN MÁXIMO DE LA RESERVA 


Hay un límite superior al volumen de la reserva, y los reforzamien- 
tos sucesivos son cada vez menos efectivos al sumarse al total a medida 
que nos acercamos al valor máximo. Las reservas relativamente gran- 
des creadas en el experimento precedente por reforzamientos únicos 
no se doblan en absoluto cuando se refuerzan las dos primeras respues- 
tas. Las curvas de extinción representadas en la figura 7 muestran las 
reservas creadas por un centenar de reforzamientos. Los números de 
las respuestas son del orden de 75 a 100, y cuando se extrapolan las 
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curvas hasta un punto en que cesaría prácticamente la respuesta, la 
altura no debería exceder de las 200 respuestas. La curva de extinción 
más grande que he visto viene reproducida en la figura 17. Se obtuvo 
mediante un procedimiento similar por el Dr. F. S. Keller y A. Kerr de 
la Colgate University con cuyo permiso la reproducimos aquí. La rata 
había recibido 250 reforzamientos antes de la extinción. 

En un capítulo posterior describiremos un método de creación de 
reservas mucho mayores, en las que las respuestas sólo se refuerzan 
periódicamente. 


PÉRDIDA DE LA RESERVA 
CON EL TRANSCURSO DEL TIEMPO 


La curva de extinción a veces se identifica injustificablemente con 
las “curvas de olvido” de Ebbinghaus y otros. Como ha observado 
Hunter (52), ambos procesos implican una pérdida de fuerza, pero, como 
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TIEMPO 


Ficura 17 


CURVA DE EXTINCIÓN EXTRAORDINARIAMENTE GRANDE DESPUÉS 
DE UN CONDICIONAMIENTO ORIGINAL 


Experimento realizado por F. S, Keller y A. Kerr 


ya he dicho en relación con el tema de la inhibición, la simple dirección 
del cambio no es una propiedad definitoria adecuada. El olvido es una 
pérdida de fuerza debida no al proceso activo de extinción (que requie- 
re la provocación sin reforzamiento), sino al transcurso de tiempo pasi- 
vo. En la forma absoluta usual de formular el problema (“¿Recuerda 
aún el organismo una respuesta?”), la cuestión es si la fuerza ha des- 
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cendido por debajo de un valor de umbral. Esto no es más que un pun- 
to final y sólo puede ofrecer una explicación burda del cambio. En el 
presente caso queremos saber hasta qué punto cambia la fuerza en fun- 
ción del tiempo cuando no se ejecuta ninguna operación sobre el orga- 
nismo que afecta bien el grado de condicionamiento o bien cualquiera 
de las otras variables en función de las cuales está la fuerza. 

Como en todos los casos de condicionamiento la cuestión realmente 
se refiere a la reserva en función de la cual está la fuerza. Para inves- 
tigar el “olvido” no tenemos más que introducir un intervalo de tiem- 
po entre el condicionamiento y la extinción y examinar el efecto que 
produce sobre la curva de extinción. Deben tomarse ciertas precaucio- 
nes referentes a otras variables. Con un organismo como la rata un 
importante ejemplo es la edad. La rata tiene una vida corta, y los cam- 
bios debidos a la edad se producen rápidamente. En el experimento 
siguiente las ratas se condicionaron a unos 100 días de edad, y las cur- 
vas de extinción fueron tomadas 45 días más tarde. En el capítulo si- 
guiente mostraremos que durante un período de esta duración no se 
produce un considerable cambio de fuerza debido a la edad. 

Una segunda variable importante que debe controlarse es el im- 
pulso. Los registros a comparar deben obtenerse bajo estados compara- 
bles de impulso. Puede hacerse una comprobación interna del grado de 
impulso a partir de la forma de la curva de extinción, como mostrare- 
mos en el capítulo 10. Se obtuvo la constancia requerida de la forma 
siguiente: Se sometió a las ratas a la rutina de alimentación usual des- 
crita en el capítulo 2 hasta que quedó bien establecido un ciclo diario 
de hambre. Entonces se efectuó el condicionamiento, y las ratas se 
trasladaron inmediatamente a su jaula-hogar, donde permanecieron du- 
rante cuarenta días con un suministro constante de comida y agua. Al 
final de este período se las trasladó de nuevo al espacio experimental y 
se las sometió a la rutina de alimentación durante cinco días. Como 
precaución contra cualquier pérdida de adaptación a la caja experi- 
mental sólo se colocaron en las cajas durante uno de los períodos de 
alimentación (el tercero). Este día se había quitado la palanca. Al cabo 
de cinco días el ciclo de hambre se había restablecido adecuadamente, 
y se obtuvieron curvas de extinción al sexto día. 

Se utilizaron cuatro ratas cuya edad y entrenamiento preliminar 
pueden equipararse a los de la figura 7. El número de respuestas refor- 
zadas el día del condicionamiento fue el mismo en los dos casos (ca. 100). 
Por consiguiente, el efecto del intervalo de tiempo entre el condiciona- 
miento y la extinción puede determinarse mediante una comparación di- 
recta de los dos conjuntos de resultados. Las curvas medias de los dos 
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grupos están representadas en la figura 18. La curva inferior correspon- 
de al grupo extinguido tras un intervalo de 45 días. La extinción duró 
un hora y veintidós minutos. La curva superior constituye la media de las 
curvas de la figura 7. Como ya he dicho, una curva media es de poca 
utilidad para mostrar la forma fundamental de la curva de extinción, ya 
que las desviaciones cíclicas se producen característicamente sólo en 
una dirección y sus longitudes de onda varían, pero sirve para resumir 
el efecto general y por ello es suficiente para nuestro propósito. 

La figura muestra que los números de respuestas que ocurren du- 
rante una hora de extinción son del mismo orden de magnitud en los 
dos casos. Las alturas medias de las curvas al cabo de una hora son 86 
y 69 respuestas en lo que se refiere a la extinción inmediata y retardada 
respectivamente, indicando sólo una ligera pérdida de reserva en los 
cuarenta y cinco días.: La forma general de la curva se mantiene. La 
curva media indica esto sólo de forma vaga a causa del achatamiento 
debido a las desviaciones por debajo de la envolvente, pero los regis- 
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CURVAS DE EXTINCIÓN MEDIAS QUE DEMUESTRAN SÓLO UNA LIGERA PÉRDIDA 
DE LA RESERVA DURANTE CUARENTA Y CINCO DÍAS 


tros individuales confirman esta afirmación. La disponibilidad de la 
reserva por lo tanto permanece también inalterada. El simple período 
de tiempo durante el cual una reserva permanece inalterada no afecta 
a la relación existente entre ella y la tasa de provocación. 

En la medida en que este experimento se cumple, podemos con- 
cluir que la rata “olvida” lentamente. Al cabo de cuarenta y cinco días 
la fuerza de la operante está muy lejos de aquel punto del umbral en 
que no se produciría ninguna respuesta o, en otras palabras, en que la 


1. Joutz (J. Exper. Psych.) que con pequeñas cantidades de reforzamiento 
(10 y 40 reforzamientos) las curvas de extinción que se obtienen al cabo de 15 
días muestran mayor número de respuestas que las que se obtienen al cabo de 1 día. 
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rata hubiera “olvidado lo que debía hacer para obtener comida”. El 
simple transcurso del tiempo constituye un factor ineficaz en lo que 
respecta a la reducción de la reserva del reflejo. 

Un experimento realizado por Keller (54) revela otro proceso re- 
lacionado con la reserva, que también tiene lugar durante un período 
de inactividad. La “recuperación espontánea” de la fíerza que se 
produce después de la extinción parcial cuando se efectúa posterior- 
mente una nueva extinción, antes se interpretó como el efecto del tiem- 
po intermedio al convertir en inmediatamente disponibles una serie de 
respuestas que se hubiesen emitido durante ese tiempo si se hubiera 
continuado la extinción sin interrupción. Al parecer, la cantidad dis- 
ponible está relacionada con la duración de la interrupción. En los ex- 
perimentos descritos más arriba, el período fue de veintitrés o de cua- 
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PRIMER DÍA SEGUNDO DÍA DÍA CUADRAGESIMO 


FicurA 19 
La “RECUPERACIÓN ESPONTÁNEA” DESPUÉS DE CUARENTA Y CINCO DÍAS 


Se procedió a una nueva extinción del grupo A los días segundo y cuadragésimo 
quinto; el grupo B sólo el día cuadragésimo quinto. Experimento realizado por 
F, S, Keller 


renta y siete horas. En el experimento de Keller fue de cuarenta y 
cinco días. 

El instrumental y el procedimiento fueron muy semejantes en todo 
lo esencial a los descritos en el capítulo 2. Los grupos de cuatro ratas 
fueron completamente condicionados cada uno reforzando de doscien- 
tas a trescientas respuestas. Cuando el impulso quedó ajustado conve- 
nientemente, se tomaron curvas de extinción de una hora y media. Al 
día siguiente se obtuvo una nueva extinción con el grupo B durante 
un período similar y después de cuarenta y cinco días con el grupo A. 
También se obtuvo una curva de extinción del grupo B el día cuadra- 
gésimo quinto. El resultado aparece en la figura 19, que da las curvas 
medias de cada grupo, en que se tomaron mediciones cada diez mi- 
nutos. 

Las curvas de extinción original tienen las propiedades típicas ya 
descritas. La curva media del grupo B de la figura 19 muestra el efecto 
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de desviaciones cíclicas más extensas en la primera parte de la cur- 
va, de tal manera que parecen indicar un grado medio de hambre ligera- 
mente inferior en este grupo (ver capítulo 10). Ambas curvas alcanzan 
esencialmente pendientes cero al final del período, y podemos concluir 
que prácticamente toda la reserva disponible en este momento ya ha 
sido agotada. Las alturas difieren en sólo unas dos respuestas (siendo la 
diferencia acumulativa a lo largo de la hora y media), y por consiguien- 
te los dos grupos están bien igualados para los propósitos del experi- 
mento. La figura 19 asimismo muestra que las curvas de la nueva ex- 
tinción tienen las propiedades usuales: una concentración de respuestas 
al principio como evidencia del “restablecimiento” y después de esto 
una sección esencialmente llana. Esto es cierto aun después de cua- 
renta y cinco días, 

El punto crucial se refiere a las cantidades de respuestas obtenidas 
en la nueva extinción los días segundo y cuadragésimo quinto. El pro- 
medio del grupo B el segundo día fue de 37; el del grupo A el día cua- 
dragésimo quinto fue de 46. Si tomamos estas cifras como signifi- 
cativas, se produce un incrememnto del veinticinco por cineto en la 
recuperación espontánea como consecuencia de posponer la nueva 
extinción cuarenta y cinco días. Los grupos son demasiado pequeños, 
desde luego, para dar un paso muy grande a la cantidad exacta, pero 
el experimento constituye una demostración cualitativa del efecto del 
intervalo sobre el restablecimiento espontáneo subsiguiente. El grueso 
del restablecimiento tiene lugar durante las primeras veinticuatro ho- 
ras, pero posteriormente hay una recuperación adicional. La tercera 
curva del grupo B el día cuadragésimo quinto muestra todavía una 
nueva recuperación, aunque no tanto como el segundo día. El número 
de respuestas de ese tercer día es más que suficiente para equilibrar 
los totales de los dos grupos. Esto era de esperar, porque el grupo B 
había sido extinguido a medias de nuevo como el grupo A y al final 
también se había aprovechado de la ventaja del intervalo de cuarenta 
y cinco días. 

Podría mantenerse que dicha desigualdad se debe a una diferencia 
de los impulsos de los grupos los días segundo y cuadragésimo quinto. 
Durante la mayor parte del período intermedio ambos grupos fueron 
alimentados continuamente, pero cinco días antes de la última prueba 
cada grupo fue sometido de nuevo a un programa de alimentación dia- 
ria por tiempo limitado. El éxito de este sistema en el sentido de pro- 
ducir aproximadamente el mismo grado de impulso se desprende de 
las formas de las curvas del día cuadragésimo quinto. Si hay alguna 
diferencia entre el grupo A el día cuadragésimo quinto y el grupo B 
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el segundo, ésta estriba en el sentido de un mayor grado de hambre 
en el último caso, que iría en contra del resultado. Esto puede inferirse 
del experimento descrito en el capítulo 10 y de la pendiente ligeramen- 
te mayor de la parte principal de la curva del grupo A. 

Aunque hay un claro incremento en la cantidad de recuperación, 
no es cierto que las ratas hayan “olvidado la extinción y recordado, en 
cambio, el condicionamiento”. Cabe esperar lo contrario o al menos 
mantenerlo como posibilidad, pero la curva después de cuarenta y cinco 
días muestra todavía el efecto de la primera extinción casi tan claramente 
como la curva tomada el segundo día. Aquí una vez más el tiempo sólo 
parece surtir escaso efecto sobre la reserva o su estado de repleción o 
de agotamiento. El caso es especialmente interesante porque el efecto 
del tiempo puede producir un incremento de la fuerza momentánea del 
reflejo contrario a la tendencia normal hacia un descenso. 

La validez de este experimento depende de la demostración hecha 
anteriormente de que hay una escasa pérdida de la reserva a lo largo 
de un período de cuarenta y cinco días de duración. Si se produce una 
ligera pérdida, el presente experimento es tanto más significativo cuan- 
to que indica una recuperación posterior en un período tan largo. 


La extinción como «inhibición» 


Al estudiar la ley de la inhibición ya señalamos que el término se 
había extendido muy ampliamente para incluir muchos tipos diferentes 
de cambios negativos de fuerza. La definición de una clase de fenó- 
menos en términos de la mera dirección del cambio no se consideró 
útil. Puede presentarse una objeción más seria al supuesto de que una 
propiedad observada en un caso de cambio negativo pueda esperarse 
en otro. Podemos ver un ejemplo de transferencia injustificada de una 
propiedad al considerar la extinción como una forma de inhibición y al 
suponer que representa la supresión de actividad. Este punto de vista 
fue propuesto por Pavlov con considerable detalle, pero es incompatible 
con el presente sistema. La metáfora de la supresión está quizá justifi- 
cada en la inhibición definida en el capítulo 1 en el sentido de que, si 
no fuera por el estímulo inhibidor, se observaría una cierta cantidad 
de actividad. Pero en la extinción no se puede señalar una fuerza su- 
presora comparable. Pavlov ha recurrido al propio estímulo condi- 
cionado (64). Así dice: “El mismo estímulo condicionado positivo, bajo 
ciertas condiciones determinadas, se vuelve negativo o imhibitorio; 
ahora evoca en las células del córtex (léase: en la conducta del orga- 
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nismo) un proceso de inhibición en lugar de la excitación usual (p. 48)”. 
Y más adelante: “Un estímulo de un reflejo condicionado positivo, bajo 
determinadas condiciones, puede transformarse en un estímulo de un 
reflejo condicionado negativo o inhibitorio (p. 67)”. Pero todo lo que 
observamos es que el estímulo ahora es incapaz de evocar la respuesta 
de la misma forma que lo era antes de tener lugar el condicionamiento. 

Otras propiedades de la extinción atribuidas por Pavlov a la inhi- 
bición son, asimismo, formuladas con igual facilidad sin el concepto. 
Explicar la dificultad de la extinción diciendo que “cuanto mayor es 
la intensidad del proceso excitatorio más intenso debe ser el proceso 
inhibitorio para vencerlo” (p. 61), no añade nada a la observación de 
que un reflejo fuerte se extingue lentamente (como debiéramos esperar 
de la relación existente entre la fuerza y la reserva). Y atribuir las fluc- 
tuaciones observadas durante la extinción a la “lucha que se desarrolla 
entre los procesos nerviosos de excitación e inhibición antes de que 
uno u otro consiga el dominio” (p. 60), es poco más que mitología. 

E] principal argumento contra la noción de una fuerza supresora 
en la extinción es de orden lógico. El número de términos de que pre- 
cisa el sistema aumenta innecesariamente. La interpretación de un es- 
tado observado de inactividad emplea el doble postulado de fuerzas 
excitatorias e inhibitorias que se anulan. El recondicionamiento debe 
considerarse como la eliminación de la inhibición (p. 67), aunque ten- 
ga todas las propiedades externas del condicionamiento original. Esto 
puede apenas justificarse diciendo que el condicionamiento original 
es también una eliminación de la inhibición, puesto que entonces nos 
veríamos abocados a la absurda conclusión de que todos los reflejos 
condicionados posibles preexisten en el organismo en un estado de ex- 
citabilidad suprimida. 


En el aspecto factual hay quien ve en el fenómeno de la recupera- 
ción espontánea una prueba del carácter inhibitorio de la extinción. 
Pero es indiferente que consideremos el restablecimiento como ocasio- 
nado por la eliminación espontánea de la inhibición o como la recu- 
peración espontánea de la fuerza. Un mejor apoyo para la concepción 
de Pavloy es el supuesto fenómeno de la “desinhibición”, en la que se 
dice que un reflejo en curso de extinción es liberado de la inhibición 
por un estímulo extraño. Este efecto, si es cierto, invalidaría la formu- 
lación dada anteriormente. La extinción no puede ser el simple ago- 
tamiento de una reserva debida al condicionamiento si la fuerza del 
reflejo puede ser restaurada por un acontecimiento que en sí no tiene 
ningún valor reforzante. Supongamos, por ejemplo, que estamos ob- 
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servando la extinción de un reflejo a lo largo de la línea punteada de 
la figura 20 (p. 97), que representa el cambio de fuerza. Si la conver- 
timos en una curva de sumación (línea sólida), que representa la canti- 
dad total de actividad (o sea, el número total de provocaciones bajo 
estimulación continua) en el tiempo, tenemos una envolvente que ca- 
racteriza la reserva y su agotamiento gradual. La curva experimental 
puede descender por debajo de esta envolvente si el organismo se ve 
perturbado de algún modo, pero no debe discurrir por encima de ella. 


FiGURA 20 16 
LA EXTINCIÓN REPRESENTADA COMO (A) DESCENSO DE TASA O (B) COMO 
INCREMENTO DE LA ACTIVIDAD TOTAL 


El efecto descrito por Pavlov se representaría esquemáticamente según 
la figura 21. La presentación de un estímulo en la flecha produciría 
un aumento de la fuerza del reflejo, y el efecto sobre la curva de su- 
mación estribaría en enviarlo más arriba de su envolvente, un hecho 
embarazoso desde el presente punto de vista. 

Sin embargo, la tentativa experimental de descubrir la desinhibición 
en curvas de extinción típicas no ha dado ningún resultado que violara 
la presente formulación. Se usaron curvas que habían sido precedidas 
de recondicionamiento periódico, ya que no se ven perturbadas de for- 
ma significativa por el efecto cíclico que caracteriza las curvas de ex- 
tinción original y por consiguiente son más convenientes para revelar 
ligeros cambios (ver el capítulo siguiente). El procedimiento consistió 
simplemente en obtener curvas de extinción en curso y luego introducir 
el estímulo “desinhibidor”. 

En el experimento se utilizaron dieciocho ratas y se efectuaron dos 
registros en seis de ellas de manera que en total se obtuvieron veinti- 
cuatro casos. Se emplearon varios estímulos extraños. En doce casos las 
ratas fueron retiradas rápidamente del aparato y echadas al aire de tal 
forma que se evocaron poderosos reflejos correctores. En tres casos se 
les punzó ligeramente la cola con una aguja. En dos casos se hizo so- 
nar el almacén de comida vacío. Este estímulo podía haber introducido 
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Ficura 21% 
Erecro SOBRE LA EXTINCIÓN ESPERADO EN CASO DE “DESINHIBICIÓN” 


algún efecto recondicionante, pero es probable que cualquier sonido 
hubiera hecho lo mismo mediante inducción (ver capítulo 5). En siete 
casos se encendió la luz directamente sobre la palanca. No se usaron 
deliberadamente intensidades menores de estimulación, pero se dieron 
incidentalmente en muchos otros experimentos, y de hecho son produ- 
cidas por la misma rata. Como quiera que la curva típica obtenida con 
este método es suave o bien cae por debajo de la envolvente, podemos 
concluir que los estímulos de bajos órdenes de intensidad no producen 
el efecto deseado. 
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RESPUESTAS 


MINUTOS 


FicuRA 2216 
Curvas DE EXIINCIÓN QUE NO MUESTRAN NINGÚN EFECTO “DESINHIBIDOR” 
En las flechas las ratas fueron retiradas rápidamente del aparato, echadas al aire 
y vueltas a colocar en él. El registro A no muestra ningún efecto. El registro B 
muestra una o dos respuestas inmediatamente después de la vuelta al aparato, 
seguidas por una ligera depresión de la tasa 
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En la figura 22 damos dos registros típicos. En las flechas las ratas 
fueron retiradas del aparato y echadas al aire de la forma descrita. El 
registro Á no muestra ningún cambio significativo en ninguno de los 
seis casos. El registro B muestra un aumento muy ligero de tasa (quizá 
dos respuestas suplementarias) inmediatamente después de la vuelta 
al aparato. Esto también sucedió en otro caso con un estímulo de esta 
clase y en otros cuatro casos en los que el estímulo era una luz. Sin 
embargo, es evidente en todos esos casos que el estímulo fue adminis- 
trado en un momento en que el registro estaba un poco por debajo de 
su envolvente, y que esas respuestas suplementarias no hicieron más 
que devolverlo a su posición correcta. En todos los otros casos no sólo 
no hubo ningún aumento de tasa, sino un descenso real después del 
estímulo “desinhibidor”. El resultado puede ser acusado y es precisa- 


Ficura 231 


La “DESINHIBICIÓN” REPRESENTADA COMO UN CAMBIO TEMPORAL 
CON COMPENSACIÓN SUBSIGUIENTE 


mente lo que debiéramos esperar cuando el estímulo es bastante fuerte 
para surtir un efecto emocional. 

Ninguno de los veinticuatro casos dio resultado alguno que invali- 
dara la interpretación de la curva de extinción como una descripción 
del agotamiento de la reserva, y los experimentos ponen considera- 
blemente en duda la realidad del efecto referido por Pavlov. Estos 
experimentos nos proporcionan varias formas de tener en cuenta las ob- 
servaciones de Pavlov sin necesidad de recurrir al fenómeno de la desin- 
hibición. Al describir un efecto de esta índole es obviamente necesario 
tener disponible toda la curva de extinción, o al menos una parte con- 
siderable de ella antes y después de la desinhibición. De lo contrario 
podemos confundir ciertos posibles incrementos de tasa en los que el 
estímulo es meramente facilitativo. Un aumento debido a la facilita- 
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ción es compatible con la presente interpretación y no constituye una 
prueba de la desinhibición. Cuando la curva coincide con la envolven- 
te un efecto posible sería un aumento momentáneo por encima de este 
punto, seguido por una plena compensación durante un período pos- 
terior de tasa disminuida. La existencia de un incremento que exceda 
la envolvente es dudosa, pero la figura 23 muestra una posible forma 
de completar la figura 21 de acuerdo con este enfoque. En el presente 
experimento la luz en particular pareció tener un efecto facilitativo, pro- 
bablemente a causa de estar situada directamente sobre la palanca, lo 
cual daría relieve a la palanca como fuente de estimulación ante la rata, 
pero la envolvente no fue sobrepasada en ninguno de esos casos. Siem- 
pre que la facilitación ocurría, la curva por alguna razón estaba debajo 
de su envolvente, y el efecto era simplemente devolverla a su posición 


RESPUESTAS 


TIEMPO EN MINUTOS 


Ficura 2416 


UN EFECTO “DESINHIBITORIO” RELACIONADO CON LA TOTALIDAD DE LA CURVA 
DE EXTINCIÓN 


En la flecha se encendió una luz colocada directamente sobre la palanca. El aumen- 

to de tasa resultante es el mayor obtenido en los 24 casos. Si se relaciona con el 

resto de la curva vemos que se trata del restablecimiento de una posición que se 
halla considerablemente por debajo de la envolvente de la curva 


correcta. El caso más sorprendente de este tipo viene reproducido en 
la figura 24. La justificación para mantener que la rata se hallaba con- 
siderablemente “atrasada” en el momento de la “desinhibición” es la 
suavidad de la primera parte de la curva, la cual le da bastante peso 
para mantener la extrapolación significativamente por encima de la 
sección media irregular, Esto puede verse más fácilmente escorzando 
la curva. Aparentemente, ninguna de las obras publicadas sobre desin- 
hibición da las curvas de extinción sobre las cuales el efecto fue ope- 
rativo. Hasta que se haga esto y que el hecho de la desinhibición se 
confirme luego, la presente interpretación no puede considerarse como 
seriamente amenazada. 

Existe una razón por la cual cabría esperar un resultado aparente- 
mente positivo en el tipo de experimento de Pavlov que estaría ausen- 
te en el caso presente. Con el reflejo salivar muchos estímulos pueden 
provocar la respuesta. Debemos tratar la salivación no sólo como parte 
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de la ingestión de comida y de la expulsión de substancias nocivas, sino 
como parte de muchas pautas de excitación emocional y aun de res- 
puestas exploratorias. Como Pavlov ha dicho: “Los pasos de un tran- 
seúnte, las conversaciones ocasionales en las habitaciones vecinas, el 
cierre brusco de una puerta o la vibración ocasionada por un camión, 
el clamor de la calle e incluso las sombras proyectadas a través de la 
ventana en la habitación... provocan un trastorno en los hemisferios 
cerebrales...” ([64], p. 20). Sería difícil hallar un estímulo desinhibi- 
dor que no produjera salivación espontáneamente. Si la envolvente es 
sobrepasada en este caso esto significa simplemente que se están in- 
cluyendo otros reflejos, esto es, que tenemos una superposición de en- 
volventes. El resultado no es la desinhibición y por lo tanto no es óbice 
para el presente sistema. 

La distinción que hago entre la extinción como supresión de acti- 
vidad y como el agotamiento de una reserva puede formularse de la 
manera siguiente. La noción de supresión se aplica a todo factor que 
altera la relación existente entre la reserva y la tasa de respuesta de 
tal forma que esta última se ve reducida. Así el reflejo en respuesta a 
la palanca se ve suprimido,*) cuando la rata no está hambrienta (ver ca- 
pítulo 9),?) cuando está asustada (ver capítulo 11),*) o cuando algún 
otro reflejo llega a prevalecer sobre él. En todos estos casos podemos 
observar incrementos posteriores de tasa, y la fuerza plena de la re- 
serva es exhibida finalmente. En la extinción, por otra parte, la pro- 
porcionalidad entre la tasa y la reserva no se ve alterada, pero la re- 
serva en sí se ve reducida. La metáfora de la supresión es inaplicable. 


La extinción de los reflejos encadenados 


La extinción del miembro inicial de una cadena de reflejos puede 
efectuarse interrumpiendo la cadena en cualquier punto anterior al re- 
flejo incondicionado en el que se basa el condicionamiento. En la 
muestra de conducta considerada aquí la operante inicial de levantar 
las patas delanteras hacia la palanca puede extinguirse rompiendo la 
cadena en cualquiera de las tres flechas de la fórmula de la página 70. 
Esto puede lograrse (respectivamente para cada una de las tres flechas) 
quitando la palanca, desconectando el almacén o vaciándolo. Para ex- 
tinguir el segundo miembro de la cadena (apretar la palanca) sólo son 
posibles dos alternativas. Pueden indicarse de la forma siguiente: 


sSD UI, RH (y —>85SDH_ RU (y, >SI, RI 
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Pueden darse los casos siguientes: 

1) La ruptura de la cadena en A produce la simple extinción de 
s9t, RE, ya que establece las condiciones esenciales para eliminar el 
estímulo reforzante SD IL, Este método no nos da información sobre 
$59 H, RE directamente, ya que mide sólo la tasa de respuesta a la pa- 
lanca, pero tras un examen detenido está claro que sSD 11, RU sigue es- 
tando condicionado. Después de una considerable extinción de sSD ", 
ER el sonido del almacén evocará inmediatamente RI, 

2) Si restablecemos la conexión en A, la primera provocación de 
sS» UL. RE recondiciona el reflejo, y si la conexión se rompe de nuevo 
se obtiene una nueva curva de extinción (ver página 97). 

3) También podemos extinguir sS>, RU! rompiendo la cadena en 
B. En las figuras 25 B y 26 C damos ejemplos de ello. No he sido capaz 
de detectar ninguna diferencia entre las curvas de extinción obtenidas 
en A y B con el número de casos hasta aquí considerados. 
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Ficura 2511 
EXTINCIÓN SEPARADA DE LOS MIEMBROS DE LA CADENA 


A: se rompe la cadena primero en A (véase el texto), y luego es restablecida 
en A y rota en B. B: se rompe la cadena primero en B y luego en A 


4) Si restablecemos la conexión en B, sSP Ul , RUI se recondicionará 
tan pronto como se provoque de nuevo y se obtendrá una nueva curva 
de extinción. 

5) Si después de la extinción en A, restablecemos la cadena en A 
pero la rompemos en B, también obtenemos el recondicionamiento de 
SSDH, REE porque SP” constituye un reforzamiento adecuado, tanto 
como si los estadios posteriores de la cadena son reforzados como si 
no (pág. 100). Pero como sS9 E , RH ahora será extinguido, no continuará 
reforzando a sS» "Il, REL y la fuerza de está última disminuirá. El efecto 
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de la reconexión en A queda mostrada típicamente en la figura 25 A. 
La primera parte de la curva muestra la extinción de sS»!, RE cuando 
la cadena se rompe en A. La desviación cíclica característica es eviden- 
te. En la flecha se restauró la conexión de A (conectando el almacén), 
pero dicha conexión se había roto en B (vaciando el almacén). Podemos 
ver que la respuesta a la palanca es recondicionada rápidamente y que 
luego sufre un segundo descenso que corresponde a la extinción del 
reflejo reforzante sS» 11, RU, Podemos obtener curvas más regulares usan- 
do la extinción tras un recondicionamiento periódico (ver el capítulo 
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TIEMPO (EN MINUTOS) 


Ficura 2611 


IXXTINCIÓN SEPARADA DE LOS MIEMBROS DE LA CADENA DESPUÉS DE UN 
RECONDICIONAMIENTO PERIÓDICO 


A y B: la cadena se rompe en A (véase el texto), y luego se reconecta en A y se 
rompe en B, C: la cadena se rompe primero en B y luego en A 


siguiente), de lo cual podemos ver ejemplos en la figura 26. Las curvas 
en A y B corresponden a la figura 25 A. Muestran el efecto de reservas 
iniciales diferentes, que dan distintas pendientes a las curvas. 

Es evidente que esas segundas curvas no están aplanadas como en 
el caso de la extinción secundaria original de la página 100. Los casos 
difieren porque en el presente experimento la respuesta había sido 
condicionada previamente. Al parecer, este hecho es responsable de la 
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mayor eficacia del condicionamiento secundario proporcionado por el 
sonido del almacén. En este caso, el condicionamiento secundario cons- 
tituye realmente un re-condicionamiento. El número de respuestas de- 
bido al efecto reforzante del sonido del almacén es de nuevo del mis- 
mo orden que en la curva de extinción original. Es tentador sugerir la 
ley siguiente: un estímulo discriminativo (como el sonido del alma- 
cén) utilizado como reforzamiento en ausencia de un reforzamiento fi- 
nal crea en otro reflejo una reserva exactamente igual a la del reflejo 
al que pertenece. Las pruebas que poseemos actualmente no son capa- 
ces de establecer la ley de forma concluyente. 

6) Si rompemos la cadena en A tras haber extinguido a partir de B, 
no obtenemos ninguna nueva curva de extinción para sSD "!, RH, Esto 
queda claro típicamente en las figuras 25 B y 26 C. La primera parte 
de cada curva corresponde a la extinción en B. En la flecha la cadena 
se rompe en A. La segunda flecha de la figura 26 C marca la restaura- 
ción del encadenamiento en A y no muestra ningún efecto significativo. 

Podemos concluir de estos registros que la interrupción de una ca- 
dena extingue todos sus miembros hasta el punto de interrupción, pero 
no más allá de él. Ya que la interrupción suprime la provocación de 
todos los miembros que vienen después de ella, puede formularse una 
ley de forma más general de la manera siguiente : 


LrEY DE EXTINCIÓN DE LOS REFLEJOS ENCARENADOS. En una cadena de 
reflejos no finalmente reforzados sólo los miembros realmente provoca- 
dos sufren la extinción. 

El procedimiento experimental no pone en claro si en el caso 8 to- 
dos los miembros de una cadena que preceden a la interrupción decli- 
nan Simultáneamente o bien si la extinción actúa hacia atrás desde el 
punto de interrupción en etapas sucesivas. En términos de la tasa de 
provocación el descenso es desde luego simultáneo, pero pueden des- 
cubrirse diferencias de reserva investigando los miembros separada- 
mente en cualquier punto dado. Debemos proceder a una comparación 
detallada de las curvas de extinción original a partir de A y B. Debiera 
aparecer una reserva mayor en el caso de B si la extinción fuera pro- 
gresiva y no simultánea. Sin embargo, parece bastante claro que se 
obtiene un número total mayor de respuestas a la palanca haciendo in- 
terrupciones sucesivas en A y B que haciendo una interrupción original 
en B. Presumiblemente cuanto más larga es la cadena tanto mayor es 
la diferencia. El mayor número de respuestas en la extinción de A y B 
separadamente es compatible con la noción de reserva, ya que en el 
caso de una interrupción inicial en A el efecto reforzante de SP =U que- 
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da preservado y puede utilizarse más tarde para crear una reserva 
adicional. 

Este experimento muestra el status autónomo de cada miembro de 
la cadena de forma muy clara. Sería difícil conciliar datos de este tipo 
con una doctrina de la “totalidad” del acto de “apretar la palanca para 
obtener comida”. 

El experimento siguiente indica que la segunda curva obtenida res- 
taurando la conexión en A y haciendo una interrupción en A se debe a 
la acción recondicionante del sonido del almacén, aunque el resultado 
es ambiguo con respecto a la reserva adicional total que pueda crearse 
de esta manera. El experimento implica la reducción del efecto refor- 
zante con un intervalo de tiempo. El efecto de un intervalo no se de- 
muestra fácilmente en el condicionamiento original, como ya he seña- 
lado, pero en el capítulo siguiente describiremos una técnica mejor con 
la cual un intervalo de sólo dos segundos de duración puede llegar a 
reducir el efecto en un tercio. Usamos el intervalo en el presente expe- 
rimento de la forma siguiente. Se obtiene primero la extinción con una 
interrupción en A. Luego se conecta el almacén vacío de tal forma que 
cada respuesta es reforzada al fin del intervalo. (La misma dificultad 
planteada por una segunda respuesta que se dé dentro del intervalo 
se trata y se resuelve de la forma antes descrita.) La nueva curva a ob- 
tener debe mostrar la eficacia reducida del reforzamiento. Cuando la 
curva ha alcanzado una pendiente baja, el reforzamiento puede hacerse 
simultáneo como una comprobación adicional. Es en este último punto 
cuando se obtiene un resultado ambiguo: en algunos casos sigue una 
tercera curva de extinción, mientras que en otros no se produce efec- 
to alguno. 

Las curvas de extinción correspondientes a las ocho ratas con que se 
experimentó mediante este procedimiento muestran el efecto de la con- 
siderable experimentación precedente que implicó un recondicionamien- 
to periódico prolongado (reflejado principalmente en el aplanamiento 
inicial de las curvas), y el resultado debe aceptarse con precaución. De 
los ocho casos, dos de ellos no mostraron ningún efecto sobre el cambio 
de reforzamientos retardados a simultáneos, cuatro mostraron un ligero 
efecto (hasta el 50% del efecto de los retardados), y dos mostraron 
del 50% al 100% o más del efecto del reforzamiento retardado. En la fi- 
gura 27 damos ejemplos del primer y del último grupo. En ambas curvas 
podemos ver que la restauración en A cuando el sonido tiene lugar 
después de un intervalo es mucho menos efectiva que en el caso si- 
multáneo anteriormente descrito. No obstante, el entrenamiento perió- 
dico prolongado previo puede ser en parte responsable de esto. En el 
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registro superior la curva de extinción que se añade cuando el refor- 
zamiento se convierte en simultáneo (en la segunda línea vertical) es 
ligeramente mayor que la añadida cuando se introduce primero el re- 
forzamiento retardado (en la primera línea vertical). En este caso, el 
intervalo fue de seis segundos. En la figura inferior no se experimentó 
ningún efecto sobre el cambio al reforzamiento simultáneo, aunque la 
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Primero no se refuerza la respuesta y se produce la extinción. Luego a la respuesta 
sigue el sonido del almacén vacío después de diferentes intervalos, tal como viene 
indicado. Más tarde se hace sonar el almacén simultáneamente con la respuesta 


introducción del reforzamiento retardado (tras un intervalo de cuatro 
segundos) dio una curva significativa. Hay una variabilidad poco co- 
rriente en el efecto del retraso, y en el capítulo siguiente veremos que 
ésta es característica de los experimentos con reforzamiento retardado. 

El sonido del almacén que sigue a una respuesta después de un in- 
tervalo recondiciona dicha respuesta hasta cierto punto. La ganancia 
de fuerza resultante se pierde mediante la extinción posterior. Cabría 
esperar que cuando la respuesta discriminatoria al sonido no hubiera 
sido reforzada con comida, éste dajará de recondicionar la respuesta 
a la palanca, aun cuando la siguiera inmediatamente. Pero en la mayo- 
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ría de los casos se produce un cierto recondicionamiento. La explicación 
probablemente radica en que el último miembro (la respuesta diferen- 
ciada al sonido del almacén) no se extingue plenamente durante la ex- 
tinción con reforzamiento retardado, porque el almacén no suena lo 
bastante a menudo como para producir una extinción completa. Por 
consiguiente, el sonido recondiciona de nuevo la respuesta a la palanca 
cuando la sigue inmediatamente. No considero que esta explicación dé 
cuenta total y satisfactoria del resultado. Varios registros son incapaces 
de mostrar el efecto, y el experimento, evidentemente, debería repetirse 
con ratas con una historia experimental más corta. 


La posibilidad del condicionamiento negativo 


Existe un tipo de estímulo reforzante en el condicionamiento tipo R 
que, aparentemente, produce un descenso en la fuerza de la operante. 
Si el acto de apretar la palanca se correlaciona con un fuerte shock, por 
ejemplo, terminará por no provocarse en absoluto. El resultado es com- 
parable al de la adaptación o la extinción, pero no hay ninguna razón 
para confundir estos procesos. La distinción entre extinción y descenso 
de fuerza con reforzamiento “negativo” se basa en la presencia o ausen- 
cia del reforzamiento y por tanto puede hacerse fácilmente. 

El efecto de un estímulo reforzante como un shock en la disminu- 
ción de la fuerza puede producirse por una reducción directa del volu- 
men de la reserva o bien por una modificación de la relación entre la 
reserva y la fuerza. Sólo en el primer caso podemos hablar de condicio- 
namiento negativo. El proceso tendría lugar en sentido contrario al del 
condicionamiento positivo y podría describirse como una reducción de re- 
serva que no precisara el gasto real de respuestas como en el caso de 
la extinción. Sin embargo, no está claro que ocurra realmente una re- 
ducción de este tipo, al menos cuando el cambio empieza después de 
un condicionamiento positivo previo en vez de en la fuerza incondicio- 
nada original. 

El caso alternativo de una modificación entre la fuerza y la reserva 
tiene entrada en el apartado de la emoción tal como será definida más 
tarde. La reacción emocional al shock es condicionada de acuerdo con 
el condicionamiento tipo S de forma tal que la palanca o los movimien- 
tos incipientes de apretar la palanca se conviertan en un estímulo con- 
dicionado capaz de provocarla. El efecto del estado emocional es redu- 
cir la fuerza de la respuesta. Cuando la palanca se presenta a la rata 
no se Emiten respuestas, no porque no haya respuesta en la reserva, 
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sino porque la palanca establece un estado emocional en el que se de- 
prime la fuerza. La incapacidad resultante para responder está, eviden- 
temente, relacionada con el fenómeno de represión. 

La segunda alternativa hace difícil demostrar la primera en el caso 
del condicionamiento simple. En el capítulo siguiente describiremos 
algunos experimentos sobre el tema general del condicionamiento ne- 
gativo que utilizan la técnica del recondicionamiento periódico. 


Comparación entre los dos tipos de condicionamiento 


En vista de la creencia expresada por Pavlov y muchos otros de 
que solamente hay un solo tipo fundamental de condicionamiento que 
sea aplicable a la conducta “adquirida”, puede ser aconsejable enume- 
rar algunas de las diferencias existentes entre los dos tipos definidos 
y descritos anteriormente. 


1) La distinción fundamental se basa en el término con que se co- 
rrelaciona el estímulo reforzante (S*). En el tipo S es el estímulo (5%) 
y en el tipo R la respuesta (R'). 


2) El tipo S es posible sólo en la conducta respondiente porque el 
necesario S” está ausente en la conducta operante. El término original- 
mente correlacionado con S* debe ser irrelevante, porque de lo contra- 
rio la correlación se daría también con R” (aun cuando difirieran las 
condiciones temporales de la correlación). El tipo R es posible sólo en 
la conducta operante, porque, en caso contrario, S* estaría correlaciona- 
do también con un estímulo. 


3) En el tipo S el cambio de fuerza tiene lugar solamente en un 
sentido positivo y (S”. R!) puede empezar en cero. En el tipo R s. R* 
debe poseer cierta fuerza incondicionada original, y el cambio puede 
ser posiblemente negativo. 


4) En el tipo S se forma un nuevo reflejo. Al principio, no es pre- 
ciso que haya ninguna correlación entre S” y R!. En el tipo R la topo- 
grafía de la operante no cambia excepto por medio de una intensifica- 
ción selectiva. Se establece una nueva forma en el sentido de que 
aparece una fuerte respuesta que tiene el conjunto único de propiedades 
determinado por las condiciones de correlación de S'. 

5) Un reflejo condicionado tipo R es, aparentemente, siempre fá- 
sico, quizás porque S' sigue a la respuesta y la termina. Como operante 
su fuerza se mide en términos de tasa, y la reserva tiene la dimensión 
de un número de respuestas. Los reflejos condicionados tipo S son prin- 
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cipalmente no-fásicos. Como respondientes su fuerza se mide en térmi- 
nos de propiedades estáticas y la reserva tiene las dimensiones de una 
cantidad total de actividad provocable. 

6) En ambos tipos la reserva puede formarse a base de reforza- 
miento repetido, y la extinción subsiguiente parece tener las mismas 
propiedades cualitativas: la fuerza declina cuando se mantiene el re- 
forzamiento; la actividad total durante la extinción depende de la can- 
tidad de retorzamiento previo; las curvas de extinción sucesivas pre- 
sentan una actividad total menor (aunque las cantidades intermedias 
de reforzamiento y las fuerzas momentáneas en que empiezan los pro- 
cesos pueden ser las mismas); y el reflejo se restablece hasta cierto 
punto cuando se le permite permanecer inactivo. Pavlov ha señalado 
que los “reflejos condicionados tipo $ recobran espontáneamente su 
fuerza plena después de un intervalo de tiempo más largo o más cor- 
to ([64], p. 58)”, pero esto se aplica a la fuerza y no a la reserva, y sus- 
cede exactamente igual en el tipo R. La tasa inicial de una curva que 
muestre restablecimiento frecuentemente es tan elevada como en la 
extinción original (ver figura 9). Pavlov también ha observado fluctuacio- 
nes rítmicas durante la extinción tipo S. La interpretación propuesta 
más arriba sobre las fluctuaciones durante la extinción de una operante 
no es válida en el caso de una respondiente. Requiere una reducción 
de la tasa de respuesta durante la cual se permite que un efecto emo- 
cional acumulativo se disipe, pero en la respondiente la tasa de pro- 
vocación se mantiene constante mediante el control del estímulo. La 
realidad de una fluctuación cíclica genuina en la extinción de una res- 
pondiente, sin embargo, puede ponerse en duda. He representado grá- 
ficamente todos los datos sobre la extinción proporcionados por Pavlov 
y he sido incapaz de hallar algo más que una considerable irregularidad. 

7) A causa del control ejercido a través de S* en el tipo S, la extin- 
ción puede pasar por cero en ese tipo. Si los datos de Pavlov son váli- 
dos, puede formarse una reserva negativa. Así, la medida de Pavlov 
de la extinción por debajo de cero es el reforzamiento suplementario 
precisado para el recondicionamiento. En otras palabras, debe aportar- 
se cierto número de respuestas a la reserva antes de que se experimente 
efecto alguno sobre la fuerza. En el tipo R es imposible una reserva 
negativa porque cuando la fuerza ha alcanzado el nivel cero no están 
disponibles nuevas provocaciones sin reforzamiento. 

Hilgard (44) ha hecho un análisis de las diferencias entre los dos 
tipos, y ha señalado que ambos generalmente se dan conjuntamente y 
que el “reforzamiento” constituye, esencialmente, el mismo proceso 
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en ambos casos. No obstante, las presentes distinciones no se ponen en 
duda.' 

Los dos tipos pueden caracterizarse de una forma más general de la 
manera siguiente: La esencia del tipo S consiste en la sustitución de 
un estímulo por otro o, como ha indicado Pavlov, en la señalización. 
Prepara al organismo obteniendo la provocación de una respuesta antes 
de que el estímulo original haya empezado a actuar, y lo hace dejando 
actuar en su lugar a cualquier estímulo que haya acompañado o se 
haya anticipado incidentalmente al estímulo original. En el tipo R no 
hay sustitución de estímulos y por consiguiente tampoco señalización. 
El condicionamiento actúa de otra forma: el organismo selecciona de 
un amplio repertorio de movimientos incondicionados aquellos cuya 
repetición es importante con respecto a la producción de ciertos es- 
tímulos. La respuesta condicionada tipo R no prepara para el estímulo 
reforzante, lo produce. El proceso es muy probablemente el referido 
en la ley del efecto de Thorndike (70). 

El tipo R juega el papel más importante. Cuando un organismo tro- 
pieza accidentalmente (es decir, como resultado de débiles reflejos 
exploratorios) con una nueva clase de comida, la cual obtiene y come, 
presumiblemente se dan ambos tipos de condicionamiento. Cuando la ra- 
diación visible de la comida estimula seguidamente al organismo, la 
salivación se evoca de acuerdo con el tipo S. Esta secreción es inútil 
hasta que la comida es realmente obtenida y comida. Pero el acto de 
obtener y de comer dependerá de los mismos factores accidentales que 
antes a menos que haya ocurrido también el condicionamiento tipo R, 
esto es, a menos que la fuerza de sSP: comida. R: captura haya aumen- 
tado. Así, mientras que un reflejo tipo S prepara al organismo, un re- 
flejo tipo R obtiene la comida para la que se hace la preparación. Esta 
constituye en general una caracterización bastante justa de la relativa 
importancia de los dos tipos. Así, Pavlov ha dicho que los estímulos 
condicionados son importantes en el sentido de proporcionar saliva an- 
tes de que se reciba la comida, pero “aún mayor es su importancia 
cuando evocan el componente motor del complejo reflejo de nutrición, 
es decir, cuando actúan como estímulos al reflejo de buscar comida 


1. El problema ha sido tratado en muchos otros artículos recientes. Schlosberg 
(Psychological Review, 1938, 44, 879-394), está de acuerdo con la distinción 
aquí establecida e insiste en que las diferencias para justificar el uso del tórmino 
condicionamiento en los casos del tipo R son demasiado grandes. Mowrer (Psycho- 
logical Review, 1938, 45, 62-91) sigue empeñado en la posibilidad de que los dos 
procesos puedan reducirse al fin a una sola fórmula. Estos artículos, así como cl 
de Hilgard, pueden consultarse en lo que se refiere a la relación del problema 
con el campo tradicional del aprendizaje. 
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([64], p. 18)”. Aunque “el reflejo de buscar comida” constituye una ex- 
presión poco afortunada, se refiere de forma bastante clara a conducta 
característica tipo R. 

La distinción entre los tipos K y S basada en su limitación a la con- 
ducta operante y respondiente respectivamente implica una tosca se- 
paración topográfica. Los reflejos tipo S, como respondientes, se limitan 
a la conducta que es originalmente provocada por estímulos específi- 
cos. Los efectores controlados por el sistema nervioso autónomo cons- 
tituyen los mejores ejemplos, uno de los cuales fue usado casi exclusi- 
vamente por Pavlov en sus estudios clásicos. Esta subdivisión de la 
conducta constituye una parte muy pequeña del campo total definido 
aquí, y gran parte de ella quedaría quizás excluida si la definición fuera 
interpretada estrictamente, A ella se pueden añadir tal vez unas cuan- 
tas respuestas esqueléticas diseminadas como la flexión de un miembro 
ante una estimulación nociva, el parpadeo, la flexión de la rodilla, etc. 
La mayor parte de los experimentos sobre conducta esquelética que 
han sido presentados como paralelos a la obra de Pavlov son suscepti- 
bles de interpretación como operantes discriminados tipo KR, como mos- 
traremos en el capítulo 6. Es perfectamente posible, según las pruebas 
que poseemos, que puede hacerse una separación topográfica estricta 
de los tipos según la distinción esquelético-autónomo. 

Toda respondiente esquelética dada puede duplicarse con operantes 
y por ello puede también condicionarse según el tipo R. No es seguro 
que esto sea cierto en lo que se refiere a la parte autónoma. Konorski 
y Miller han afirmado que no lo es (57). Hay pocas razones para espe- 
rar un condicionamiento tipo R en una respuesta autónoma, ya que por 
regla general no actúa, naturalmente, sobre el ambiente de ningún modo 
que pueda producir un reforzamiento, pero se puede lograr que lo haga 
mediante medios instrumentales, En colaboración con el doctor E. B. De- 
labarre he tratado de condicionar la vasoconstricción del brazo en su- 
jetos humanos haciendo depender un reforzamiento positivo de la 
constricción. Los experimentos hasta ahora no han dado ningún resulta- 
do concluyente, pero hay muchas observaciones clínicas que parecen 
indicar la existencia de un condicionamiento de este tipo. El campo 
Operante corresponde de forma bastante exacta a lo que tradicional- 
mente se ha venido llamando conducta “voluntaria”, y el control “vo- 
luntario” de algunas actividades autónomas ha quedado bien estable- 
cido. El niño que ha aprendido a derramar “lágrimas de verdad” para 
producir un estímulo reforzante ha adquirido, aparentemente, una ope- 
rante autónoma condicionada. 
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La simple existencia del control “voluntario” de una respondiente 
no prueba que la respuesta haya sido condicionada según el tipo R. La 
respondiente puede estar encadenada a una operante de acuerdo con 
la fórmula : 

s.RE-—=> SI, RI 


de tal forma que el “control se ejercita a través de s. RU, Se plantean 
cuatro casos según las posibilidades de que S! sea condicionado o in- 
condicionado y exteroceptivo o propioceptivo. Los ejemplos son los 
siguientes : 

1) Incondicionado y exteroceptivo: s. RU: acto de clavar un alfiler 
en el propio brazo —>S*: punzada.R*: aumento de la tensión arterial. 
Esto no se llamaría ordinariamente control voluntario de la tensión 
arterial, pero representa un tipo de control operante. Si la elevación de la 
tensión arterial se correlaciona con un reforzamiento (a través de me- 
dios instrumentales), s. RU aumentará, con tal que el reforzamiento sea 
lo bastante grande para vencer el reforzamiento negativo de la punzada. 
Así, si a un hombre hambriento se le diera comida siempre que su ten- 
sión arterial subiera, podría recurrir al uso de un alfiler para producir 
este efecto. 

2) Incondicionado y propioceptivo: s. RU: rápida actividad muscu- 
lar +>S!: estimulación propiocentiva . Ri; aumento de la tensión arterial. 
Este caso es muy similar al precedente. Si el cambio de la tensión 
arterial se correlacionara una vez más con un reforzamiento positivo, 
s. KR! aumentaría. Nuestro hombre hambriento podría recurrir también 
a este expediente. 

En ambos casos la correlación del reforzamiento con RM es equiva- 
lente a correlacionarlo con R!, porque las conexiones entre RI y SH y 
entre S! y RE son prácticamente invariables. Lo que se hace en este 
caso es esencialmente basar el reforzamiento en una operante definida 
como todo movimiento que produzca un cambio de tensión arterial. La 
única condición del reforzamiento especificada no produciría necesaria- 
mente la respuesta de punzar la piel en el primer caso y un rápido 
movimiento en el segundo. Toda respuesta que ocurriera y produjera 
el efecto sería condicionada. Pero es todavía cierto que en ambos casos 
se ha adquirido una especie de control “voluntario” de la tensión ar- 
terial, 

3) Condicionado y exteroceptivo.s.R': acto de mirar a un cua- 
dro-> St: cuadro . RI: efecto emocional. En este caso no se precisa 
recurrir al medio instrumental, ya que algunos ejemplos de RI son en 
sí reforzantes (es decir, “placenteros”). Este caso se aplica a la conduc- 
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ta muy común de leer libros interesantes, de mirar o de pintar cuadros 
bonitos, de tocar buena música, de rememorar escenas agradables, etc. 
El resultado, una vez más, no se llama ordinariamente control *volun- 
tario” de la respuesta emocional, pero representa un tipo de control 
operante. 

4) Condicionado y propioceptivo.s.R5!: recitación subvocal de 
poesia —> SI; efecto propioceptivo . RI: respuesta emocional, Aquí una 
vez más RI puede ser reforzante en sí misma y por lo tanto es posible 
que no precise de conexión instrumental con un estímulo externo re- 
forzante. 

El conocido experimento de Hudgins (46) cae dentro de las dos 
últimas categorías. Se condiciona un estímulo tipo S (la palabra *con- 
traer”) para provocar la contracción de la pupila presentándolo simul- 
táneamente con una luz fuerte. Al final el sujeto puede producir él 
mismo el estímulo (conducta operante) y con ello resulta la contracción 
de la pupila. Cuando el estímulo se produce en voz alta, nos hallamos 
ante el caso 8); cuando se produce subaudiblemente, ante el caso 4). 
Debe quedar claro del análisis precedente que el experimento no de- 
muestra una contracción condicionada con arreglo al tipo R y por ello 
no se asemeja a una verdadera operante condicionada como el hecho 
de fruncir los labios. Delabarre y yo hemos confirmado fácilmente el 
experimento de Hudgins en el caso de la vasoconstricción. El sujeto 
decía “contraer” y se producía una detonación con objeto de ocasionar 
una fuerte vasoconstricción. Al final la constricción se producía tras la 
pronunciación no reforzada de la palabra “contraer”. El caso subaudible 
no se demostró claramente. 

En vista del posible encadenamiento de la operante y la respon- 
diente es difícil decir si una respuesta autónoma puede en realidad 
condicionarse en cualquier caso, de acuerdo con el tipo R. La informa- 
ción procedente del mismo organismo en lo que respecta a cómo ejerce 
el control “voluntario” no es digna de crédito. En los experimentos so- 
bre vasoconstricción hallamos que en el caso de un resultado aparen- 
temente positivo el sujeto cambiaba el volumen del brazo modificando 
la cantidad de aire residual de sus pulmones. En este caso, la profun- 
didad de la respiración se hallaba condicionada de acuerdo con el tipo R 
a causa del reforzamiento de su efecto sobre el volumen del brazo. 
El resultado “positivo” se obtuvo muchas veces, antes de que el sujeto 
descubriera el paso intermedio. 

Aparte de la cuestión de si todas las respuestas pueden condicio- 
narse de acuerdo con el tipo R, podemos afirmar de forma contundente 
que una gran parte de la conducta no puede condicionarse con arreglo 
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al tipo S. Después de la investigación clásica del condicionamiento 
tipo S se llegó a mantener, generalmente, que el tipo era aplicable uni- 
versalmente. Pero gran parte del trabajo original se había basado en 
las respuestas de las glándulas y de los músculos lisos, y la extensión 
del principio a los músculos estriados se enfrentó con un éxito ambi- 
guo. Se supuso que la fórmula se aplicaría en caso de sustitución de 
Una respuesta glandular por una esquelética, como en el ejemplo típico 
siguiente: 


S: tono . r. 
S: shock e “=—R: flexión. 


Aquí el tono debía ser seguido por una flexión en ausencia del shock, 
como en el experimento pavloviano era seguido por la salivación en la 
ausencia de comida. Los resultados no fueron satisfactorios. Se encon- 
tró que la respondiente esquelética condicionada, generalmente, se des- 
arrollaba lentamente y que era relativamente inestable. Una tasa baja 
de condicionamiento no era un resultado perturbador en el caso de 
las respuestas de las glándulas y de los músculos lisos, que son carac- 
terísticamente lentas, pero el resultado obtenido en el laboratorio en 
caso de respuestas esqueléticas no fue satisfactorio a la hora de explicar 
las propiedades altamente móviles ordinarias de la conducta esqueléti- 
ca. A la luz de la distinción operante-respondiente ello se comprende 
fácilmente. La mayor parte (si no toda) la conducta esquelética es ope- 
rante y condicionada con arreglo al tipo R. La fórmula del tipo S es 
aplicable, si acaso, sólo dentro de un campo limitado. Gran parte de 
la plausibilidad dada a la extensión del tipo S ha procedido de la con- 
fusión con el tipo R, que surge del hecho de que la mayoría de los es- 
tímulos que provocan respondientes esqueléticas son también estímu- 
los reforzantes para el tipo R. Es difícil imponer condiciones al tipo S 
en una respuesta esquelética que no sean también las condiciones del 
tipo R. Algunos de los casos mixtos resultantes serán considerados más 
tarde en el capítulo 6. 
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A. Recondicionamiento 
periódico 


Estados intermedios de condicionamiento 


Una operante puede fortalecerse o debilitarse por medio del refor- 
zamiento o de su ausencia, pero los fenómenos de aquisición y de pér- 
dida de fuerza sólo constituyen una parte del campo definido por el 
reforzamiento como operación. En el campo tradicional del “aprendiza- 
je” se da frecuentemente la implicación de un “saber” o “no-saber” 
absolutos. En el presente sistema tenemos que considerar también esta- 
dos de fuerza intermedios sostenidos y relativamente estables debidos 
a la operación del reforzamiento. Fuera del laboratorio muy pocos re- 
forzamientos son infalibles. Quizás los más seguros son los reforzamien- 
tos táctiles correlacionados con los estímulos discriminativos visuales 
del mundo exterior. Es casi invariablemente cierto que en presencia de 
determinados tipos de estímulos visuales ciertos movimientos de mi 
brazo producen la estimulación táctil de mi mano. Sólo bajo condicio- 
nes ilusorias (como en los espejos) o cuando los estímulos discriminati- 
vos son tan vagos como para ser ambiguos (como en una habitación 
escasamente iluminada) las conexiones mecánicas necesarias entre las 
fuentes visuales y táctiles de estimulación están ausentes. La contingen- 
cia de otros estímulos reforzantes es incierta. Esto es particularmente ver- 
dadero en el campo verbal, que puede definirse como aquella parte de 
la conducta que se refuerza sólo a través de la mediación de otro orga- 
nismo. La contingencia del agua como fuente de estímulos reforzantes 
sobre la respuesta articulada: “¡Agua!” evidentemente es de un orden 
de magnitud enteramente diferente del del tacto sobre la vista. Esto tam- 
bién es cierto para otros tipos de reforzamiento puramente mecánicos, 
Mi pipa no está siempre en mi bolsillo, y una cerilla no se enciende 
siempre. Al buscar mi pipa y al encender una cerilla, mi conducta está 
marcada hasta cierto punto por el efecto de la ausencia previa de re- 
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forzamiento. Las fuerzas de esos reflejos no son totalmente dependien- 
tes del estado del impulso, de mi estado emocional, etc., sino también 
del grado de condicionamiento. 

En general, los estados de fuerza de los reflejos condicionados de 
un organismo se encuentran por debajo del máximo posible con res- 
pecto a la operación del reforzamiento. Esta importante propiedad de 
la conducta sólo puede tratarse adecuadamente superando la noción 
de fuerza momentánea. Bajo el recondicionamiento periódico surgen 
propiedades especiales de los reflejos condicionados que no tienen con- 
trapartida en el condicionamiento y la extinción originales de una re- 
flejo. Son propiedades de la reserva del reflejo y de la relación de la 
reserva con la tasa de provocación. Podemos abordar el tema examinan- 
do el efecto del recondicionamiento periódico sobre el estado de nues- 
tra operante representativa. La periodicidad del reforzamiento se 
mantendrá constante, aun cuando no suceda así en absoluto fuera del 
laboratorio. 


Recondicionamiento periódico 


En el capítulo 3 hemos descrito registros de extinción tras reducidas 
cantidades de recondicionamiento. El proceso de recondicionamiento 
y de extinción puede repetirse a voluntad. Pero si un segundo recondi- 
cionamiento sigue inmediatamente al primero, lo que resta de la pri- 
mera curva de extinción llega a sumarse a la segunda. Si el recondicio- 
namiento se repite periódicamente a un intervalo menor que la duración 
media eficaz de la curva de extinción para la cantidad de recondicio- 
namiento empleado, las curvas sucesivas continúan sumándose hasta 
que, finalmente, tiene lugar una fusión completa y la fuerza del reflejo 
permanece a un valor constante en tanto se mantiene el recondiciona- 
miento periódico. 

El desarrollo de un estado de fusión viene representado en la figu- 
ra 28. Los registros corresponden a dos ratas cuya respuesta había sido 
extinguida el día anterior. En ambos casos podemos ver una pérdida 
de extinción (en A y A”) pero la tasa de provocación rápidamente al- 
canza un valor muy bajo, que se mantiene durante unos 25 y 35 mi- 
nutos respectivamente. En B y B” se estableció un programa de recon- 
dicionamiento periódico, según el cual la respuesta a la palanca era 
seguida por la administración de un gránulo de comida cada cinco mi- 
nutos y las respuestas intermedias no eran reforzadas. Indicamos las 
respuestas reforzadas con barras verticales. Las curvas de extinción 
en B y B' tienen la forma usual, si tenemos en cuenta la dificultad que 
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supone aproximarse a una curva tal con tan sólo unos 10 ó 12 peldaños 
poco marcados. Sin embargo, las curvas en C y C” muestran miembros 
ascendentes mucho más largos que, aparentemente contienen las res- 
puestas sobrantes de las curvas precedentes. Las terceras curvas tienen 
miembros ascendentes todavía más largos y, como se siguen los otros 
recondicionamientos, el carácter de cada curva finalmente se pierde y 
los registros adquieren una pendiente constante. A partir de aquí la 
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RESPUESTAS 


TIEMPO (1 HORA) 


FIGURA 28* 


FusióN DE LAS CURVAS DE EXTINCIÓN SUCESIVAS DESPUÉS DEL REFORZAMIENTO 
DE RESPUESTAS AISLADAS (EN B, C, ETC.) 


provocación prosigue a una tasa regular, y no es posible decir en base 
a la conduca registrada, dónde ocurren los reforzamientos sucesivos. 

La fuerza constante adquirida por la operante bajo el condiciona- 
miento periódico es muy estable. En un experimento en el que se com- 
probó la fuerza a cuatro diferentes tasas de recondicionamiento, se 
mantuvieron valores esencialmente constantes durante las veinticuatro 
horas experimentales. Se asignaron a las cuatro ratas machos P7, P9 P8 
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y P10 los intervalos entre reforzamientos sucesivos de 3, 6, 9 y 12 mi- 
nutos respectivamente. Las ratas tenían 106 días al iniciarse el experi- 
mento. Como quiera que no fue posible obtener la provocación de una 
respuesta inmediatamente después de que se conectara el almacén, los 
intervalos no pudieron determinarse exactamente. La demora al emitir 
la respuesta se añadió al intervalo, y los intervalos medios resultantes 
para la serie fueron de 3 minutos y 6 segundos, 6 minutos y 27 segun- 
dos, 9 minutos y 47 segundos, y 12 minutos y 59 segundos respectiva- 
mente. En los otros experimentos que describiremos la demora se dedujo 
del intervalo subsiguiente de manera que la media fuera exactamente 
la de la duración programada. 

Antes de esta serie de observaciones se había condicionado y ex- 
tinguido la respuesta a la palanca. Se colocó cada animal en su caja a 
la misma hora diariamente (a las 9 de la mañana) y aproximadamente 
unos dos minutos más tarde se le permitió la entrada a la parte prin- 
cipal de la misma en donde la palanca le era accesible. La primera res- 
puesta a la palanca fue reforzada, y después de esto se reforzaron 
respuestas concretas aisladas de acuerdo con el programa. Se registra- 
ron todas las respuestas a la palanca, tanto las reforzadas como las no 
reforzadas. En cada caso se alcanzó una tasa de provocación constante 
característica. Se sacaron los animales de las cajas al cabo de una hora, 
y se les dio comida suplementaria en sus jaulas-hogares durante dos 
horas. No se les dio más comida hasta el día siguiente (no experimen- 
tal), en que se les administró una ración entera a las nueve de la maña- 
na. Este procedimiento se repitió los veinticuatro días experimentales. 

Los resultados aparecen en cuatro series de 24 registros quimográ- 
ficos, que describen la conducta de las ratas con respecto a la palanca 
durante un total de 96 horas experimentales. En la figura 29 (pág. 136) 
presentamos el experimento completo. La figura está construida a base 
de representar gráficamente el número total de respuestas alcanzadas 
al cabo de cada día en las ordenadas y el número de días en las absci- 
sas. El curso aproximado de cada registro diario fue trazado (a pulso) 
entre esos puntos separados. Los detalles de los registros originales se 
pierden en la inevitable reducción de tamaño, pero en las figuras 80 
y 31 reproducimos registros típicos de cada serie, y sus posiciones en 
la figura 29 se indican con corchetes en la dicha última figura, corres- 
pondiendo el orden de ocurrencia en los dos casos. Así, la curva co- 
rrespondiente a P7 de la figura 29 representa una serie de 24 registros 
quimográficos unidos para formar una gráfica continua, de los que la 
figura 30 muestra, leyendo de izquierda a derecha, el cuarto, el sexto 
y el decimoséptimo. 
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NÚMERO TOTAL DE RESPUESTAS 


PERÍODOS EXPERIMENTALES DIARIOS 


FicuraA 299 


RESPUESTAS A LA PALANCA DURANTE 24 PERÍODOS EXPERIMENTALES DIARIOS 
DE UNA HORA CADA UNO 


Las respuestas se reforzaron de la manera siguiente: P7 cada tres minutos, P9 cada 
seis minutos, P8 cada nueve minutos y P10 cada doce minutos 


La conclusión más evidente que se saca de la figura 29 es que el 
valor de la tasa conseguida está en función de los intervalos entre los 
recondicionamientos sucesivos. Cuanto más corto es el intervalo, más 
abrupta es la pendiente de la gráfica. Ya volveré a insistir sobre esta 
relación. También es evidente que no se observa ningún cambio muy 
significativo de tasa en cualquier intervalo dado durante el período del 
experimento. En la medida que concierne a cada registro diario, de 
hecho no hay ninguna desviación consistente de la línea recta, aunque 
todos los registros muestran irregularidades locales. La curvatura obser- 
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FiGURA 30? 
TkrES REGISTROS DIARIOS DE LA SERIE CORRESPONDIENTE A P7 DE LA FIGURA 29 
Las posiciones en la figura 29 aparecen indicadas con corchetes 


vada en algunos pocos casos (ver P9, figura 31) no sigue ninguna regla 
consistente de un día para otro. En la serie completa, por otra parte, 
la tasa de provocación no es estrictamente constante, pero muestra un 
ligero descenso tenaz y significativo. Es imposible en el momento pre- 
sente correlacionar un efecto tan débil con cualquier condición espe- 
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RESPUESTAS 


100 


P 10 


TIEMPO (CADA REGISTRO UNA HORA) 


FIGURA 312 
TrrES REGISTROS DE CADA UNA DE LAS SERIES CORRESPONDIENTES A P9, P8 
Y P1O DE LA FIGURA 29 


Las posiciones en la figura 29 aparecen indicadas con corchetes 


cífica del experimento. Las curvas de la figura 29 abarcan un período 
de 47 días, y hay muchos cambios progresivos a los que pudiera atri- 
buirse un efecto de esta magnitud. Por lo que respecta a cualquier sec- 
ción breve del gráfico la curva puede considerarse como esencialmente 
rectilínea. 

Las desviaciones locales de la línea recta peculiar a esos registros 
son de cuatro órdenes claramente distinguibles. El primero de ellos ca- 
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rece de importancia. Ignorando la curvatura de las gráficas de la figu- 
ra 29, debemos todavía tener en cuenta una variación del tipo siguien- 
te. Al principio, la tasa de provocación presenta un ligero pero continuo 
incremento que puede extenderse a lo largo de un período de varios 
días y que puede verse disimulado por el progresivo descenso de tasa 
que tiene lugar simultáneamente. Luego, en un día (o a lo más dos 
días) la tasa desciende hasta un valor que es mínimo para la curva en 
cuestión. A partir de este punto se produce un lento restablecimiento, 
que puede persistir durante varios días. Cuando la tasa ha alcanzado 
Otra vez un valor relativamente alto, se produce otro rápido descenso, 
y se repite de nuevo el restablecimiento. La gama a lo largo de la cual 
la tasa varía es reducida, pero es suficiente para dar a los registros un 
ligero efecto “festoneado”. Esta característica es excepcionalmente pro- 
minente en la curva correspondiente a P9 de la figura 29, pero puede 
detectarse en las otras curvas si las escorzamos fuertemente. Ha apa- 
recido también en experimentos de la misma índole. La causa de la 
variación es desconocida. 

Hay desviaciones de un segundo orden que son mucho más notables 
y que se hallan claramente correlacionadas con las especiales condicio- 
nes del experimento. Sólo las encontramos en las tasas de provocación 
muy elevadas (inducidas con recondicionamiento más frecuente) y no 
están presentes durante los primeros días del experimento. No hay nin- 
gún signo fiable del efecto en la figura 30 A, para el cuarto día de la 
serie, aunque hacia el sexto día aparecieron claramente desviaciones de 
este tipo (registro B). Se parecen a las del primer orden, con la impor- 
tante excepción de que su duración es de un orden de magnitud ente- 
ramente diferente. En la figura 30 B podemos observar que la tasa 
de provocación media se incrementa gradualmente hasta el sexto re- 
forzamiento. Luego se deprime de repente. Se produce un restableci- 
miento regular subsiguiente que conduce a un segundo punto máximo 
en el cuarto reforzamiento a contar desde el final. Aquí aparece otra 
depresión, cuyo restablecimiento se ve interrumpido por la terminación 
del período. Así, pues, el registro queda dividido en tres segmentos, 
cada uno de ellos de aceleración positiva que aparece en puntos que 
muestran una clara discontinuidad. El efecto quedó establecido más 
claramente (aunque en este caso algo más irregular) hacia el día deci- 
moséptimo, registro C. 

A pesar de esas desviaciones de segundo orden la tasa básica media 
de provocación permanece inalterada; los tres registros de la figura 30, 
por ejemplo, son aproximadamente paralelos. Por consiguiente, el efec- 
to tiene dos fases discretas: una marcada por un aumento por encima de 


139 


la tasa básica y la otra por una depresión por debajo de ella, que pue- 
den combinarse para dar la tasa básica como resultante. Estas dos fa- 
ses pueden observarse en la figura 30 y en la figura que vamos a pasar 
a describir (figura 32). Cuando se produce una restricción en una fase, 
hay un ajuste correspondiente de la otra. En la figura 30 la tasa básica 
es ya tan elevada que todo incremento se enfrenta probablemente con 
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EXTRAORDINARIO DESARROLLO DE LAS DESVIACIONES DE SEGUNDO ORDEN 


un límite práctico. (El aparato es capaz de absorber una tasa por 
lo menos un 50% más elevada que la más alta aquí observada.) Por lo 
tanto, la fase deprimida no tiene que hacer ninguna compensación ex- 
tensiva y es de una duración bastante corta. Los dos registros de la fi- 
gura 32, que pueden compararse con los de la figura 30, se obtuvieron 
en días sucesivos al final de una larga serie de observaciones sobre otra 
rata cuyo intervalo de recondicionamiento periódico era de cinco mi- 
nutos. La tasa básica (dada aproximadamente por una línea recta tra- 
zada entre los puntos finales de cada registro) es moderada. Por tanto, es 
posible un aumento muy grande y en realidad así se observa, nota- 
blemente en los segmentos iniciales de las dos curvas. Por consiguiente, 
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los períodos de tasa deprimida son mucho más extensos. La figura 32 
constituye un ejemplo mucho mejor del efecto de segundo orden, pues- 
to que presenta un desarrollo más pleno de la fase aumentada. También 
muestra claramente que la desviación fundamental es el aumento de 
tasa y que la fase deprimida se inicia sólo como un factor de compen- 
sación. La naturaleza de las desviaciones de segundo orden será tra- 
tada de nuevo en el capítulo 7. 


Las desviaciones de tercer orden aparecen como depresiones de la 
tasa de provocación después del recondicionamiento periódico del re- 
flejo. Son seguidas típicamente por incrementos compensatorios de 
forma tal que la tasa total permanece inalterada. Con un período de re- 
condicionamiento relativamente breve las depresiones empiezan a apa- 
recer al cabo de pocos días. Están ya presentes hasta cierto punto en 
la figura 30, registro A, y han quedado bastante claras en el registro B. 
Dan un carácter escalonado al registro C, el día decimoséptimo de la 
serie, Se puede observar que el mismo efecto es aparente, aunque en me- 
nor grado, en los registros obtenidos con recondicionamiento a interva- 
los más largos (ver figura 31). Aquí su desarrollo es considerablemente 
retardado. En el capítulo 7 mostraremos que la desviación de tercer 
orden es una discriminación temporal que no puede evitarse en el re- 
condicionamiento periódico. El reflejo en respuesta a la palanca in- 
mediatamente después de la recepción de un gránulo se ve debilitado 
porque en este momento nunca es reforzado. 


Las desviaciones de cuarto orden no son peculiares al procedimiento 
del recondicionamiento periódico. Ya han sido tratadas en relación con 
la extinción y son características de la conducta general del organismo. 
Por una parte, son expresión de la tendencia de las respuestas a pro- 
ducirse en grupo —una forma de facilitación descrita en el capítulo 1— 
y por otra, del predominio ocasional de los estímulos no eliminados con 
éxito de la situación experimental. Aquí, una vez más, el fenómeno 
parece Ser una compensación adecuada y probablemente completa de 
las desviaciones en uno u otro sentido. En la figura 31 y en otras figu- 
ras pueden hallarse fácilmente ejemplos de los dos efectos. 


Esos cuatro órdenes son claramente definibles en términos de sus 
propiedades observadas. Tomados conjuntamente, incluyen todas las 
desviaciones de la línea recta halladas en los presentes registros. La 
única posibilidad de confusión está entre el tercero y el cuarto que 
son aproximadamente de la misma magnitud: cuando una desviación 
de cuarto orden ocurre inmediatamente después del reforzamiento de 
una respuesta (y ello es probable cuando es debido al predominio 
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de otros estímulos), es indistinguible del tercero. Por esta razón es difí- 
cil detectar la primera aparición del efecto de cuarto orden, aunque 
la dificultad puede superarse por medio de un tratamiento estadístico. 

En las tasas más bajas de respuesta que acompañan a las frecuencias 
más bajas de reforzamiento se plantea la dificultad de interpretar la 
tasa constante, que no puede explicarse simplemente en términos de 
la superposición de curvas de extinción, ya que es menor que la tasa 
observada en la parte inicial de la curva de extinción. En la figura 28 
la tasa inicial casi se alcanza porque la tasa final es elevada, pero en 
casos como los de P8 y P10 de la figura 31, la tasa constante está muy 
por debajo de los valores originalmente observados en la extinción. La 
tasa constante sólo se alcanza mediante una reducción de la tasa in- 
mediatamente después del reforzamiento. Una reducción no puede efec- 
tuarse mediante la superposición de curvas de extinción, sino que 
debe implicar otros factores. En el capítulo 7 trataremos con cierto de- 
talle la producción de una tasa constante. Como en el caso de las desvia- 
ciones de tercer orden, se halla implicada en ella una discriminación 
temporal. 

En resumen, el recondicionamiento periódico de un reflejo estable- 
ce una fuerza estable constante que puede persistir sin cambio esencial 
a lo largo de veinticuatro horas experimentales distribuidas a lo largo 
de cuarenta y siete días. La tasa se debe a la fusión de curvas de ex- 
tinción sucesivas, pero el carácter de cada curva se pierde a causa de 
una discriminación temporal. Esta estabilidad es de una importancia 
considerable en la conducta normal del organismo y veremos que ex- 
perimentalmente reviste un gran valor cuando abordemos el estudio 
de la discriminación, que necesariamente implica reforzamientos y ex- 
tinciones alternativas. 


La razón de extinción 


Habiendo examinado en qué medida podemos considerar mues- 
tras curvas experimentales como rectilíneas, podemos dirigir nuestra 
atención a la relación entre una tasa de provocación dada y el período 
de rencondicionamiento en que ésta es alcanzada por la rata. En la 
figura 29 era evidente que la tasa y el intervalo entre los reforzamien- 
tos variaban en proporción inversa, pero la relación no es fiable porque 
probablemente se hallan presentes diferencias individuales. Estas di- 
ferencias pueden neutralizarse utilizando un gran número de animales 
en cada pendiente o bien procediendo a la rotación de un reducido 


142 


número de ellos a través de una serie de pendientes. El primer mé- 
todo no ha sido probado, pero un experimento utilizando el segundo 
método arrojó el resultado siguiente: Se usaron cuatro ratas (P3, P4, 
P5 y P6) de la misma familia y aproximadamente de la misma edad. 
Habían sido condicionadas cincuenta días antes. Entretanto, en días 
alternos, se habían estudiado varios aspectos de la respuesta, en base 
a una serie de experimentos la mayor parte de los cuales requerían 
recondicionamiento periódico a intervalos de 15 minutos durante pe- 
ríodos de una hora. Se comprobaron las cuatro ratas a intervalos elegi- 


TABLA 1 


INTERVALOS ENTRE REFORZAMIENTOS 


Días P3 P4 PS P6 


1-2 3 5 7 9 
3-4 5 7 9 3 
9-6 7 9 3 9 
7-8 9 3 5 Mí 
9-10 3 E) de 9 


dos para cubrir la mayor parte de los cambios de pendiente de la Éi- 
gura 29, a saber, 3, 5, 7 y 9 minutos, de acuerdo con el programa de 
la tabla 1. Cada rata permaneció en cada uno de estos intervalos du- 
rante dos días y en sus dos últimos días fue sometida de nuevo al 
intervalo en el que empezó. En la tabla 2 damos la tasa media de las 


TABLA 2 


RESPUESTAS POR HORA EN DIFERENTES INTERVALOS DE REFORZAMIENTO 


Intervalo P3 P4 P5 P6 Media 
DIO idas 315 197 458 305 319 
O Ml iii 256 196 391 221 266 
LAS ds 226 158 333 164 220 
DAMMAM. 170 144 280 131 169 
Media 249, 174 353 206 
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respuestas por hora de cada rata en cada intervalo. Cada entrada consti- 
tuye el promedio de dos observaciones, excepto para el intervalo en que 
cada rata empezó, en que se tomaron cuatro observaciones. La existen- 
cia de grandes diferencias individuales es puesta de relieve por la tasa 
media de las series prescindiendo de la duración del intervalo, que van 
de 174 a 353 respuestas por hora. La media en cada intervalo está libre 
del efecto de esta variación individual y es el resultado requerido. El 
efecto posible sobre las medias del peso suplementario de los promedios 
de las cuatro observaciones puede ignorarse para nuestros propósitos. 

El resultado es representado gráficamente en la figura 33. Las me- 
dias mostradas por la línea gruesa dan una relación aproximadamente 


RESPUESTAS POR HORA 


INTERVALOS EN MINUTOS 


Ficura 33 


La TASA DE RESPUESTA EN FUNCIÓN DEL INTERVALO ENTRE REFORZAMIENTOS 
PERIÓDICOS 


lineal. Las íneas más delgadas correspondientes a las ratas individuales 
difieren un tanto en pendiente, pero son también más o menos linea- 
les. Esta relación es hasta cierto punto fortuita, ya que es imposible en 
una serie tan breve de observaciones corregir el efecto de “acumula- 
ción” de un día experimental al siguiente. Si la rata ha estado respon- 
diendo a la palanca a una tasa constante, se obtendrá esa tasa al prin- 
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cipio de un nuevo período experimental aun cuando la frecuencia de 
recondicionamiento del nuevo período vaya a justificar una tasa supe- 
rior o inferior. El ajuste a la nueva frecuencia se produce con rapidez, 
pero el promedio del período entero necesariamente muestra el efecto 
de la tasa inicial anómala. Por consiguiente, ya que los intervalos de 5, 
7 y 9 minutos en el presente programa siguen a intervalos más cortos 
en cada caso, cabe esperar que las tasas observadas en los primeros 
días a esos intervalos sean en cierta medida excesivamente elevadas. 


RESPUESTAS 


TIEMPO 


(CADA REGISTRO EQUIVALE A UNA HORA) 


FicurA 34 


ACELERACIÓN DE LA TASA DESPUÉS DEL CAMBIO DEL REFORZAMIENTO CADA NUEVE 
MINUTOS AL REFORZAMIENTO CADA TRES MINUTOS 


Las pendientes predominantes bajo el reforzamiento cada nueve minutos están 
representadas por las líneas rectas 


Los intervalos de tres minutos, por otra parte, siguen a intervalos más 
largos en todos los casos, y por lo tanto las tasas observadas son pro- 
bablemente demasiado bajas. Comparando los dos casos vemos que la 
transferencia de una tasa baja a una alta tiene lugar más lentamente 
y viene indicada más claramente en los registros. En la figura 34 
reproducimos dos curvas típicas para mostrar el cambio de un intervalo 
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de reforzamiento de nueve minutos a uno de tres. Las líneas rectas dan 
las pendientes predominantes el día anterior en el intervalo mayor. 
Las curvas experimentales muestran una aceleración uniforme de este 
valor a los valores máximos predominantes en la nueva frecuencia. El 
valor máximo se alcanza aproximadamente a la mitad de la hora. Para 
nuestros propósitos podríamos haber permitido una cierta tolerancia 
estimando la pendiente alcanzada al final en cada intervalo en vez de 
usar el número total de respuestas por hora. El resultado dado en la 
figura 38 no pretende ser independiente de las condiciones particulares 
del experimento. Se demuestra una relación entre pendiente e intervalo, 
libre del efecto de toda diferencia individual significativa, pero no apa- 
rece su naturaleza precisa. 


Una forma de expresar la constancia de la tasa obtenida bajo re- 
condicionamiento periódico es decir que el efecto del reforzamiento 
de una sola respuesta es constante. Como ya hemos señalado, el nú- 
mero de provocaciones observadas durante el primer intervalo en una 
serie (por ejemplo, tal como viene registrado en la figura 28) es evi- 
dentemente menor que el número debido al recondicionamiento inicial, 
ya que la curva de extinción se ve claramente interrumpida; ello tam- 
bién es cierto para unos cuantos intervalos posteriores. La tasa de 
provocación se ve rápidamente acelerada, sin embargo, hasta que se al- 
canza una tasa constante dada. Si atribuimos la aceleración a la aparición 
eventual de las respuestas restantes en las curvas interrumpidas, debe 
considerarse que el logro de una tasa constante significa que el número 
de respuestas ahora observadas en un solo intervalo es precisamente el 
número debido al recondicionamiento de una respuesta. El output, 
precisamente, equilibra al input y no se excluyen respuestas que pro- 
duzcan una nueva aceleración. 

Voy a representar esta relación con la razón Ne/Nc, en que Ne es 
al número de respuestas no reforzado y Nc el número recondicionado. 
Cuando Nc=1, la denominaré la razón de extinción. En el presente 
caso su valor es constante durante una extensa serie experimental. Di- 
vidiendo el número total de respuestas de cada registro de la figura 29 
(10.700, 3.980, 2.420 y 2.200) por el número de minutos de la serie 
(1.440), obtenemos tasas medias de 7,10, 2,51, 1,57 y 1,45 respuestas 
por minuto para las ratas P7, PO, P8 y P10 respectivamente. Si ahora 
multiplicamos por el número de minutos en la tasa media en la que 
se observó cada una, obtenemos 22,8 16,1, 15,2 y 18,8, como el número 
de respuestas por reforzamiento. Para tener en cuenta los intervalos 
completos al fin de cada período experimental, podemos suponer una 
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compensación completa al día siguiente y obtener otro conjunto de 
valores dividiendo el número total de respuestas de cada serie por el 
número total de respuestas reforzadas. Los valores resultantes son aproxi- 
madamente los mismos: 22,8, 17,4, 15,1 y 18,4. Con el primer método se 
obtiene una media de 18,2; con el segundo una media de 18,4. Asimis- 
mo, en el experimento representado en la tabla 2 obtenemos 819, 266, 
220 y 169 respuestas por hora para los cuatro intervalos de 3, 5, 7 y 9 
minutos respectivamente, y dividiendo por el número de veces que cada 
intervalo está contenido en 60 minutos, obtenemos valores de 16,0, 
22,2, 25,6 y 25,4 respuestas por reforzamiento. Se ha indicado que el 
valor del intervalo de tres minutos probablemente es demasiado bajo 
y los otros demasiado altos, y ello está de acuerdo con esas medias. Por 
lo tanto, dentro de amplios límites, la razón de extinción es más o me- 
nos independiente de la frecuencia de recondicionamiento. 

Podemos concluir señalando que por cada respuesta reforzada, se 
observan unas 18 sin reforzamiento. No obstante, este valor de la razón 
de extinción depende de muchos factores como el impulso y las condi- 
ciones del reforzamiento, algunos de los cuales serán examinados más 
tarde. No se mantiene cuando Nc es mayor que uno. La relación 
entre un número de respuestas continuamente reforzadas y el número 
obtenido en la extinción subsiguiente no es en absoluto del mismo tipo, 
como ya vimos en el capítulo 3. En el recondicionamiento periódico 
se observa un cambio escaso o nulo cuando se refuerzan periódicamente 
dos o tres respuestas juntas. En un experimento complementario sobre 
este punto el reforzamiento se produjo cada ocho minutos y el número 
de respuestas reforzadas cada vez fue de una, dos o tres. Se obtuvieron 
treinta y cinco registros de una hora de duración y divididos casi por 
un igual entre los tres casos, de un grupo de cuatro ratas, cada una 
de las cuales contribuyó a cada grupo. Las tasas medias expresadas en 
respuestas por hora fueron las siguientes : 


1 respuesta reforzada cada ocho minutos 212 
2 respuestas reforzadas cada ocho minutos 221 
3 respuestas reforzadas cada ocho minutos 213 


El experimento no muestra ningún incremento de tasa significativo 
con el aumento del número de respuestas reforzadas. Esto puede expli- 


1. Youtz (J. Exper. Psychol., en prensa) ha obtenido razones de sólo 1,2:1 
cuando 40 reforzamientos son seguidos por la extinción y de 1,7 : 1 mediante 
10 reforzamientos. 
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carse como una discriminación (véase el capítulo siguiente) en que el 
estímulo discriminativo para el segundo o tercer reforzamiento viene 
suministrado por el reforzamiento anterior. Una respuesta discrimina- 
tiva contribuye poco o no contribuye en nada a la reserva, 


Ya hemos llamado la atención sobre el hecho de que atribuir la 
tasa constante adquirida bajo el recondicionamiento periódico simple- 


RESPUESTAS 


TIEMPO EN HORAS 5 


FicuraA 355 
CurvA COMPUESTA OBTENIDA EXPERIMENTALMENTE 


La extinción original se combina con la aceleración obtenida bajo reforzamiento 
periódico 


mente a la superposición de curvas de extinción es inexacto porque 
la tasa final bajo recondicionamiento periódico puede estar muy por 
debajo de la tasa inicial en la extinción. Hay que señalar aquí una se- 
gunda razón. Si el recondicionamiento periódico empieza cuando la 
tasa de respuesta ya es alta, no mantiene inmediatamente su tasa even- 
tual. Aparece primero una curva de extinción, durante la cual desciende 
la tasa original, y a partir de la cual finalmente surge la tasa periódica. 
La figura 85 constituye un registro típico que muestra la extención ori- 
ginal de un reflejo durante la cual la respuesta fue reforzada periódica- 
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mente (tal como viene marcado por guiones encima del registro). La pri- 
mera parte de la curva no puede distinguirse de la extinción simple. 
La pendiente periódica aparece al tercer o cuarto reforzamiento. Las 
líneas punteadas son curvas teóricas de los procesos de extinción y del 
desarrollo de la pendiente constante, la suma de las cuales da la curva 
experimental. Ya veremos que la aceleración positiva debida al reforza- 
miento periódico no puede decirse que empiece antes del tercer o cuar- 
to reforzamiento. Aquí podemos recurrir a la misma explicación que en 
el caso de las desviaciones de tercer orden. La reserva subyacente a 
la tasa constante observada durante el recondicionamiento periódico 
implica una discriminación temporal. El presente efecto será tratado 
de nuevo cuando abordemos el problema de la discriminación. 

En la figura 36 de la página 134 presentamos un promedio de cua- 
tro curvas que muestran la misma superposición. 


La extinción después de recondicionamiento periódico 


El efecto del recondicionamiento periódico sobre la reserva que se 
refleja en la fuerza estable adquirida por el reflejo, también afecta a 
la curva de extinción que resulta cuando el reforzamiento se omite 
por completo. En el capítulo anterior ya han aparecido ejemplos de 
curvas de extinción después de recondicionamiento periódico (figuras 
22, 24 y 26), utilizándose en lugar de curvas de extinción original a cau- 
sa de la ausencia de desviaciones cíclicas. La diferencia se debe al pare- 
cer a la adaptación del efecto emocional que sigue a la falta de reforza- 
miento, al brindar el procedimiento periódico grandes oportunidades 
para la adaptación. 

La suavidad resultante es sólo una de las propiedades distintivas 
de la curva posperiódica. Otra de ellas es una reducción de la tasa a la 
que ésta desciende. Esto se nota después de unos pocos reforzamien- 
tos periódicos. En la figura 86 damos en A el promedio de las cuatro 
curvas de extinción original de la figura 7, y hemos sombreado el área 
cercada durante una hora. La misma figura de la curva media de otro 
grupo de cuatro ratas, en que la extinción siguió a un breve recondicio- 
namiento periódico. Los dos últimos grupos han sufrido cantidades 
comparables de recondicionamiento antes del experimento. En ningún 
caso se había producido ninguna extinción anterior, pero para el grupo 
B ocurrió la extinción original al principio del registro. La primera 
parte de la curva representa una combinación de extinción y aceleración 
positiva debida al recondicionamiento periódico similar a la descrita 
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anteriormente (ver figura 35). Hacia el séptimo reforzamiento se había 
establecido claramente una pendiente constante, y en ese punto se in- 
terrumpió el reforzamiento. La línea de base de la curva de extinción 
se ha añadido a la figura y se ha sombreado el área cercada durante cin- 
cuenta y cinco minutos. Por una razón que daremos en el capítulo 7 la 


RESPUESTAS 


TIEMPO EN.MINUTOS 


Ficura 36 


¿ExTINCIÓN ORIGINAL COMPARADA CON LA EXTINCIÓN DESPUÉS DE RECONDICIONAMIENTO 
PERIÓDICO 


A: promedio de las curvas de la figura 7. B: grupo similar periódicamente refor- 
zado siete veces sin extinción previa (cf. figura 35) y luego extinguido 


extinción comienza en la primera omisión de un reforzamiento. El área 
es considerablemente mayor que la de la curva de extinción original en 
A. Se observaría una diferencia mucho mayor si el recondicionamiento 
periódico se hubiese llevado a cabo durante varias horas diarias. 

Por supuesto, el uso de curvas arbitrariamente llevadas a término 
de esta forma es peligroso. El incremento de superficie no es el resul- 
tado básico del procedimiento, y el aumento mostrado en la figura 36 
es condicional a la frecuencia de reforzamiento periódico relativamente 
alta. Cuando se ha establecido una tasa baja de provocación por refor- 
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zamiento infrecuente, el área puede ser en realidad menor en el caso 
de curvas posperiódicas si no son llevadas demasiado lejos. En la figu- 
ra 37, las curvas de extinción correspondientes a P9 y P10 tomadas inme- 
diatamente después del prolongado recondicionamiento periódico mos- 
trado en la figura 29 son comparadas con la curva de extinción original 
correspondiente a P9 de la figura 9. El área de la primera hora es mayor 
para la extinción original, porque las curvas después de recondiciona- 


k- 100 


RESPUESTAS 


PERÍODOS DIARIOS 


FiGURA 37 


EXTINCIÓN DESPUÉS DE REFORZAMIENTO PERIÓDICO A UNA TASA BAJA COMPARADA 
CON LA EXTINCIÓN ORIGINAL 


miento periódico comienzan en tasas bajas. No obstante, el procedimien- 
to ha reducido considerablemente el retraso, y las curvas posperiódicas 
al final alcanzan una altura mucho mayor. Sólo disponemos de datos 
de un segundo día para la extinción original, pero el resultado está cla- 
ro. El registro se tomó tras un día intermedio de no-respuesta, como 
ya hemos indicado anteriormente, para conseguir que la oportunidad 
de la “recuperación espontánea” fuera comparable en los dos casos. 
La recuperación es extraordinariamente grande, pero a pesar de ello 
la pendiente media de los dos días es ya menor que la de uno cualquie- 
ra de los restantes registros, 

En las figuras 38 y 39 reproducimos registros representativos de ex- 
tinción después de un reforzamiento periódico considerable. La figu- 
ra 38 se ha construido de la misma forma que la figura 29. Los dos pri- 
meros días dan las pendientes de control bajo recondicionamiento pe- 
riódico a intervalos de cinco minutos. (El registro del segundo día 
correspondiente a P6 quedó destruido debido a un fallo del aparato. La 
pendiente fue entonces estimada a partir de registros previos.) La va- 
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riación individual de tasa sigue el orden ya dado para esas ratas en 
la quinta línea de la tabla 2, esto es, P5> P3> P6> P4. La extinción 
se extiende del tercer al séptimo días. Las líneas trazadas a través de 
los registros son curvas teóricas que usaremos en un capítulo posterior. 
La figura 39 da los cuatro primeros registros diarios para la rata P3. 


RESPUESTAS 


PERÍODOS EXPERIMENTALES DIARIOS 


FicurA 38? 
EXTINCIÓN DESPUÉS DE REFORZAMIENTO PERIÓDICO 


Los dos primeros días muestran las pendientes que se obtienen bajo reforzamiento 
periódico. Después de la línea vertical no se reforzó ninguna respuesta 


Muestra la ausencia de las desviaciones cíclicas características de este 
tipo de extinción. Para revelar más efectivamente el carácter del cam- 
bio se prolongó el primer período a una hora y cuarto. 

Los principales efectos del recondicionamiento periódico sobre la 
extinción pueden resumirse de la manera siguiente: Dos efectos son 
independientes de la frecuencia o cantidad de recondicionamiento. El 
primero de ellos es la ausencia de las desviaciones cíclicas que se ob- 
servan característicamente en la extinción original. El segundo es el 
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cambio en el retraso: dada la misma tasa inicial, la curva de extinción 
posperiódica descenderá mucho más lentamente. El tercer efecto 
depende de la frecuencia de reforzamiento y se refiere a la tasa inicial, 
que se reduce por el recondicionamiento periódico, excepto cuando la 
frecuencia es muy alta. Un cuarto efecto está en función de la cantidad 
de recondicionamiento que ha tenido lugar y está relacionado con el 
cambio en la razón Ne/Nc cuando Nc se incrementa por encima de 1. 
No podemos comparar las alturas de las curvas de extinción (en un pun- 


RESPUESTAS 


kk 1 HORA 5 


FiGuRA 399 


CUATRO PRIMEROS REGISTROS DIARIOS CORRESPONDIENTES A P3Ú A PARTIR DE LA 
SERIE QUE EMPIEZA EN LÍNEA VERTICAL DE LA FIGURA 38 


to arbitrario) sin tener en cuenta el reforzamiento precedente. El efecto 
del recondicionamiento periódico sobre la altura puede formularse de 
esta forma: el medio más eficaz de construir una reserva con un nÚú- 
mero dado de reforzamientos es administrarlos periódicamente. Las al- 
turas observadas en la figura 88 no se hubiesen alcanzado si todos los 
reforzamientos del recondicionamiento periódico precedente se hubie- 
ran agrupado sólidamente. Tal vez está justificada una formulación más 
extrema. En mi experiencia ninguna cantidad de recondicionamiento 
continuo producirá una curva de extinción de la altura obtenida me- 
diante cantidades incluso pequeñas de recondicionamiento periódico. 
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En la figura 10 ya dimos las dos curvas que muestran el recondicio- 
namiento después de la extinción de recondicionamiento periódico para 
ese grupo de ratas. 

La estabilidad de la fuerza del reflejo bajo recondicionamiento 
periódico y la prolongación de la curva de extinción después de él 
constituyen importantes propiedades de la conducta normal. Son res- 
ponsables de una medida de ecuanimidad en un mundo en que la con- 
tingencia de los estímulos reforzantes es necesariamente incierta. La 
conducta sería torpe e ineficaz si una operante fuera a oscilar de un 
extremo a otro en presencia o ausencia de su reforzamiento. Los cam- 
bios repentinos de esta variable son indeseables porque otros parámetros 
que deben entrar en acción si la fuerza es baja, no pueden retirarse rá- 
pidamente cuando ya no se necesitan más. El grado de impulso necesario 
para provocar una respuesta cuando el condicionamiento es débil sería 
molesto si el condicionamiento fuera a volverse fuerte de repente. 
Cuando un reforzamiento falla, sería contraproducente que todas las res- 
puestas disponibles en la reserva se gastaran inmediatamente como 
en la extinción original, 

Aún más importante para nuestros presentes propósitos es la cons- 
tancia de la razón de extinción. Como medio de estudio del efecto de 
diversas propiedades del reforzamiento, posee muchas ventajas sobre 
el condicionamiento original. 


La razón de extinción en el estudio del condicionamiento 


Al tratar el condicionamiento original en el capítulo anterior, en- 
contramos difícil obtener uniformidad cuantitativa entre los casos a cau- 
sa de los problemas de topografía y encadenamiento. Por consiguiente, 
resultó imposible estudiar satisfactoriamente el efecto de una condición 
del reforzamiento sobre la tasa o la reserva. La constancia de la razón 
de extinción nos brinda un método para la investigación de esos pro- 
blemas. El hecho de que la razón sea aproximadamente la misma para 
intervalos tan distantes como tres y nueve minutos indica que es una me- 
dida relativamente precisa del efecto del reforzamiento. Variando el tipo 
o condición del reforzamiento debemos ser capaces de obtener una me- 
dida directa del resultado en términos de la tasa de respuesta, con tal 
que la frecuencia del reforzamiento se mantenga constante. Hay con- 
troles adecuados para el mantenimiento de la constancia de la tasa 
(como por ejemplo las curvas de la figura 29) si el experimento no es 
demasiado largo. Las desviaciones locales que aparecen entre refor- 
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zamientos no revisten significación, puesto que no afectan a la tasa me- 
dia final. 


El efecto de un intervalo de tiempo 
entre la respuesta y el reforzamiento 


Sólo dispongo de un experimento que utilice la razón de extinción 
de esta forma, pero constituye una demostración bastante adecuada de 
la utilidad general del método. Se refiere al efecto sobre el grado de 
condicionamiento del intervalo de tiempo que transcurre entre la res- 
puesta y el reforzamiento. Se reconoce generalmente que la relación 
temporal es de alguna importancia en el proceso de condicionamiento, 
al menos si el intervalo es largo. Sin embargo, a menudo se da por 
supuesto que un intervalo corto es insignificante, en particular en los 
sistemas psicológicos que suponen la existencia de algo parecido a una 
“percepción de la relación entre el acto y el resultado”. Los sistemas de 
esta índole generalmente no disponen de forma alguna de medir los 
estados intermedios de fuerza, y es tal vez injusto criticarlos por esta 
razón. 

El plan del experimento era simple. Se introdujeron diversos inter- 
valos de tiempo entre la provocación de la respuesta y su reforzamiento, 
y se observó el efecto como una modificación de la tasa de provoca- 
ción bajo recondicionamiento periódico. Los intervalos se obtuvieron 
con el aparato ya mencionado en el capítulo 3, que se introdujo en el 
circuito entre la palanca y el almacén. Cuando la rata respondía el apa- 
rato se ponía en marcha y unos cuantos segundos más tarde el almacén 
descargaba un gránulo. El dispositivo tiene esta importante propiedad : 
si durante el intervalo se emite una segunda respuesta, la cuenta empie- 
za de nuevo de forma que antes de que ocurra un reforzamiento debe 
transcurrir de nuevo un intervalo entero. 

Este dispositivo plantea las dificultades siguientes: a) No se tiene en 
cuenta la posible coincidencia de una segunda respuesta con un refor- 
zamiento retardado. En este caso la respuesta es reforzada simultánea- 
mente. En los experimentos que siguen se dio este caso con muy poca 
frecuencia. Su efecto sería el de hacer el intervalo medio más corto, 
y se supone que ello es irrelevante en el presente grado de precisión. 
b) Una segunda dificultad es inherente al problema. Un intervalo puede 
medirse o bien desde el principio de una respuesta a la palanca o bien 
desde el final de la misma, es decir, desde la pulsación inicial o desde 
el momento en que la rata suelta la palanca. En el primer caso el resul- 
tado es que la rata puede estar todavía manteniendo la palanca hacia 
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abajo en el momento del reforzamiento, aun después de un intervalo 
considerable. Pero en el segundo caso el reforzamiento puede seguir 
a la pulsación inicial en un intervalo considerablemente más largo de 
lo previsto. Esta dificultad es algo más que técnica. Si la rata aprieta 
la palanca y la mantiene hacia abajo, por ejemplo, unos tres segundos, 
¿en qué momento podemos decir que ocurre la respuesta? En los 
presentes experimentos se ha dado por supuesto que la parte importante 
de la respuesta es la pulsación inicial, y los intervalos se han medido 
a partir de este momento. Por ello, ocasionalmente, en especial en los 
intervalos más cortos, la palanca aún es mantenida hacia abajo en el 
momento del reforzamiento. Debe tenerse en cuenta un posible efecto 
sobre el resultado en el sentido de reducir el intervalo, aunque no lo 
tratamos expresamente en este lugar. 

En un experimento se condicionó de la forma usual a un grupo 
de doce ratas, de unos 150 días de edad. Tras una hora de extinción 
la respuesta a la palanca fue recondicionada periódicamente. Duran- 
te la primera hora diaria el intervalo de recondicionamiento fue de cua- 
tro minutos; durante el resto del experimento fue de cinco. Todas las 
ratas adoptaron una tasa de respuesta aproximadamente constante. Des- 
pués de tres días de recondicionamiento periódico se introdujeron inter- 
valos antes de los reforzamientos periódicos de la forma antes descrita, 
siendo asignadas tres ratas a cada intervalo. Este procedimiento de 
reforzamiento retardado se prosiguió unos tres días. Durante los dos 
días siguientes el reforzamiento fue de nuevo simultáneo. 

Toda vez que la frecuencia del recondicionamiento permanece cons- 
tante, el resultado podría expresarse como una reducción de la razón 
de extinción, pero, en este momento, me referiré simplemente a la tasa. 
Tal como ha quedado registrado, el efecto constituye una reducción de 
la pendiente de la curva de sumación. El cambio viene indicado en la 
figura 40, en que la tasa, expresada en respuestas por hora, se puede se- 
guir a lo largo del experimento. Las medias de todas las ratas, pres- 
cindiendo de la duración del intervalo, vienen dadas por la línea más 
gruesa. Las tasas del segundo y el tercer día de recondicionamiento 
periódico (días 1 y 2 en el gráfico) fueron de 190 y 193 respuestas 
por hora respectivamente. El primer día de reforzamiento retardado (du- 
ración media del intervalo: cinco segundos) la tasa descendió a 120 
respuestas por hora y durante los dos días siguientes permaneció cerca de 
este valor (121 y 118). Al volver al reforzamiento simultáneo la tasa 
subió inmediatamente a 173 respuestas por hora y el día siguiente a 
175 respuestas por hora. Los últimos valores indican una reducción de 
la tasa original de casi un 10%, que es aproximadamente del orden 
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del descenso espontáneo de la razón de extinción (ver figura 29). El 
efecto de la introducción de los intervalos es una reducción de la tasa 
en casi un 37%, 

Las curvas correspondientes a los grupos separados son mucho me- 
nos suaves, en parte a causa del pequeño número de animales de cada 
grupo (tres); pero cada serie presenta el mismo resultado como media. 
En general, cuanto más largo es el intervalo más marcado es su efecto, 
pero se produce una inversión en el caso de los grupos de dos y cuatro 
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DESCENSO DE TASA CON LA INTRODUCCIÓN DE INTERVALOS ENTRE LA RESPUESTA 
Y EL REFORZAMIENTO PERIÓDICO 


Los intervalos (de 2, 4 y 8 segundos) están indicados en la figura 


segundos. Esto se explica, en parte, por el hecho de que cuatro segundos 
es un intervalo óptimo para producir coincidencias entre el reforza- 
miento y una respuesta posterior, al menos para los animales y el grado 
de impulso utilizado en esos experimentos; pero esto no constituye 
problablemente una explicación adecuada de toda la diferencia. La 
inversión es todavía mayor de lo que aparece en la figura, cuando se 
hace una corrección de la diferencia de las tasas originales (ver días 1 
y 2). El grupo de ocho segundos se sitúa más significativamente por 
debajo del grupo de seis segundos cuando se hace una corrección similar. 

Si tomamos la media de los tres días como la tasa básica de cada 
intervalo, podemos expresar el efecto relativo del intervalo como el 
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porcentaje de la tasa original perdida. Las cifras de la tabla 3 están 
calculadas según los datos no corregidos: 


TABLA 3 
AA A AA AAA AAA 
Descenso de tasa 
Intervalo ; 
en porcentajes 
a 382 
e 18 
ota 51 
a cas 52 


En otro experimento con cuatro grupos de tres ratas cada uno, de 
unos 180 días de edad, se introdujeron los intervalos antes del reforza- 
miento en los primeros dos días de recondicionamiento periódico. Du- 
rante los tres días siguientes el reforzamiento fue simultáneo; a con- 
tinuación, siguieron tres días en los que se retrasó de nuevo con el mismo 
intervalo, y los tres días siguientes fue otra vez simultáneo. Este siste- 
ma continuó durante 23 días. En ese tiempo se efecuaron varios ex- 
perimentos exploratorios, como cambiar el procedimiento durante la 
hora (ver figura 42, p. 162), introducir un día de extinción comple- 
ta, etc., pero es posible obtener de los registros los datos siguientes 
sobre el presente punto: 


1. En25 casos se obtuvieron tres registros diarios sucesivos con re- 
forzamiento retardado después de dos o más días con reforzamiento 
simultáneo. 

2. En 20 casos se obtuvieron tres registros sucesivos con reforza- 
miento simultáneo después de dos o más días con reforzamiento re- 
tardado. 

La primera de estas series se compone de siete casos en dos segun- 
dos, siete casos en cuatro, cinco casos en seis, y seis casos en ocho. En 
la figura 41 damos en A las tasas del último día simultáneo y de los 
tres días de reforzamiento retardado. En este caso los registros se han 
representado gráficamente en su forma original (número de respuestas 
con respecto al tiempo) y no en forma de tasa con respecto al tiempo 
como en la figura 40. Las curvas representan sólo los puntos finales 
de los registros reales. No se intenta reproducir los cambios que tienen 
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lugar durante cada hora. Las diferencias originales de pendiente pe- 
riódica han sido corregidas asignando a cada grupo un factor de correc- 
ción, los valores del cual fueron de 0,93, 1,00, 1,22 y 0,91 para los gru- 
pos de 2, 4, 6 y 8 segundos de intervalo respectivamente. Cuando una 
serie se multiplica en conjunto por su factor, la tasa del primer día (re- 
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Ficura 41% 
DESCENSO DE TASA BAJO REFORZAMIENTO RETARDADO 


Representamos gráficamente aquí en la forma registrada un segundo conjunto de 

datos similares a los de la figura 40. A: la pendiente media de los registros diarios 

bajo recondicionamiento periódico disminuye cuando se introducen intervalos antes 

del reforzamiento de la forma indicada (2, 4, 6 y 8 segundos). B: la pendiente 

media de los cuatro grupos en A vuelve a su valor original cuando el reforzamiento 
es de nuevo simultáneo 


forzamiento simultáneo) se convierte en la media para los cuatro gru- 
pos. Los registros subsiguientes pueden entonces compararse direc- 
tamente, En la figura 42, que veremos en breve, reproducimos un 
conjunto típico de registros obtenidos en un solo experimento. 

En la figura 41 el grupo muestra en A el efecto de los diversos in- 
tervalos. La sola curva del primer día de la pendiente media que se 
obtiene bajo recondicionamiento periódico el día antes del cambio a 
reforzamiento retardado. Las cuatro curvas coinciden aquí a causa de 


159 


la corrección efectuada. La introducción de intervalos ocasiona un des- 
censo de esa pendiente, que aumenta todavía más en los días siguien- 
tes. De nuevo podemos ver que, en general, cuanto mayor es el in- 
tervalo tanto mayor es el efecto, pero que aparece de nuevo una 
inversión, esta vez entre los seis y ocho segundos. Expresado en por- 
centaje de descenso de la tasa periódica original calculada a partir de 
los datos no corregidos (sólo los valores de los dos últimos días fueron 
promediados, puesto que la tasa no se había estabilizado el primer 
día), el efecto de los intervalos viene dado en la tabla 4: 


TABLA 4 
A A A AAA A A 
Descenso de tasa 
Intervalo É 
en porcentajes 
ll is ERER E 33 
Dt 42, 
O isa 57 
nr 51 


El registro en B de la figura 41 muestra el retorno a la pendiente 
original bajo reforzamiento simultáneo. La curva del primer día es el 
promedio de los días precedentes prescindiendo de la duración de los 
intervalos. En los tres días siguientes el reforzamiento fue simultáneo. 
Aquí el valor pleno de la pendiente original se alcanza (o casi) porque 
se han elegido los datos al azar a partir de la serie entera y, por lo 
tanto, no será apreciable un descenso progresivamente espontáneo. 

En ninguno de los experimentos se demuestra que el efecto del in- 
tervalo sea una simple función de su duración. No obstante, los dos 
experimentos se anulan, en cierto sentido, en la medida en que se re- 
fieren a desviaciones debidas a un simple orden. Al menos podemos 
decir que no ha mostrado ninguna discontinuidad consistente. Las irre- 
gularidades son del tipo que cabría esperar dada la imposibiladad para 
excluir los factores extraños, pero no de la naturaleza compleja o dis- 
continua de la función. Ya hemos señalado dos factores a los que se 
puede atribuir las irregularidades. Uno de ellos (reforzamiento simul- 
táneo coincidente) podría eliminarse permitiendo al experimentador vi- 
gilar a la rata. El otro necesita investigarse directamente. Se trataría 
de hallar el punto de la secuencia de acontecimientos denominado “la 
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respuesta” a partir del cual los intervalos medidos muestren la mayor 
simplicidad en su efecto. Este experimento requeriría un gran número 
de animales y sería de un orden y rigor enteramente diferentes. Más 
tarde describiremos una tercera clase de irregularidades. 

El presente resultado puede expresarse de esta forma: el efecto 
de un intervalo, si no ordenado, al menos es grande. Los descensos de 
tasa medios en porcentajes para los dos grupos aparecen en la ta- 
bla 5, A pesar de las dos inversiones, el efecto es más o menos propor- 


TABLA 5 
Descenso de tasa 
Intervalo Ñ 
en porcentajes 
dal, 38 
Ae nad dec ados 30 
nadia 54 
A O 52, 


cional a la duración y es de gran magnitud. Un intervalo de una dura- 
ción de sólo dos segundos reduce el efecto del reforzamiento en un 
tercio. 

Es importante aclarar que no estamos estudiando el efecto del re- 
forzamiento sobre la tasa de condicionamiento. Al parecer la tasa en 
que el efecto se produce no se ve involucrada o es de un orden diferen- 
te de magnitud. Por lo tanto, nuestros experimentos no son comparables 
con las investigaciones del efecto de una “recompensa retardada” so- 
bre una curva de aprendizaje. Lo que queda afectado es el número 
de respuestas aportadas a la reserva por un solo acto de condicionamien- 
to. La tasa constante representa un equilibrio entre el input y el output; 
si el input se ve afectado al reducir la eficacia del reforzamiento, el 
output debe disminuir. Ya he considerado el caso extremo en que el in- 
put cesa por completo. El resultado es que la tasa desciende siguiendo 
una curva de extinción hasta un último valor de cero. En el caso pre- 
sente el valor final viene determinado por la eficacia del reforzamiento 
que queda. Para estar acorde con la interpretación precedente debería 
haber un cambio gradual, y no brusco, de la tasa superior a la inferior. 
En el primer día de reforzamiento retardado la razón aparente de las 
respuestas no reforzadas con respecto a las reforzadas debería ser ma- 
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yor que el valor garantizado por el nuevo reforzamiento, pues algunas 
de esas respuestas son debidas al reforzamiento simultáneo previo, cuyo 
efecto ahora se está extinguiendo. La tasa debería disminuir de un 
valor al otro, no bruscamente, sino siguiendo una curva de extinción, 
Esto es lo que sucede realmente tal como puede verse en la figura 41, 
aun sin disponer de la información detallada sobre los registros diarios. 
La pendiente del primer día de reforzamiento retardado es interme- 
dia. El segundo día la hallamos aproximadamente a su valor final para 
cada intervalo; en el caso del intervalo de seis segundos sólo hay un 
ulterior descenso, lo cual seguramente no es significativo. Al volver al 
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recondicionamiento simultáneo deberíamos hallar una rápida acelera- 
ción hacia la antigua tasa máxima, similar a la observada después de 
la extinción o discriminación. Ya veremos observando la curva B de la 
figura 41 que la transición a la nueva tasa no es completamente brusca. 

En la figura 40 prácticamente el cambio de tasa se realizó, en toda 
su amplitud, al fin del primer día. Pero esos promedios inducen a error, 
y es necesario prestar atención a los registros individuales para seguir 
el cambio de una forma exacta. Esos registros son de dos clases: uno 
muestra la curva de extinción claramente (en él la tasa desciende de 
un valor a otro siguiendo una curva suave), el otro muestra un efecto 
que, exactamente de la misma forma, no ha aparecido en ninguna par- 
te en experimentos con este método. La figura 42 presenta un caso 
representativo del cambio normal. La curva se compone de seis registros 
diarios consecutivos correspondientes a una de las ratas de la figura 41. 
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El primer día se aplica el reforzamiento simultáneo. El curso probable 
de la curva, si hubiese proseguido el reforzamiento simultáneo, viene 
indicado proyectando la pendiente de este día con una línea discon- 
tinua. Los días segundo, tercero y cuarto, y durante 20 minutos del 
día quinto se introdujo antes del reforzamiento un intervalo de ocho 
segundos. El cambio resultante es del tipo que cabía esperar. La cur- 
va, una vez examinada, resulta ser muy similar a las vistas anterior- 
mente para la extinción después de recondicionamiento periódico y 
para la discriminación (véase el capítulo 5). El tercer día se produce 
una ligera “cresta” (la tasa inicial es demasiado alta), pero ésta se ve 
compensada por la retardación subsiguiente. 

El quinto día se cambiaron las condiciones del reforzamiento du- 
rante la hora con objeto de observar el resultado sin la interferencia del 
restablecimiento espontáneo. Aunque el registro está considerablemen- 
te reducido en la figura, es aparente una suave aceleración positiva que 
empieza como mínimo hacia el segundo reforzamiento simultáneo. La 
tasa alcanza el punto máximo al cabo de cinco o seis reforzamientos. 
En muchos casos que implican una vuelta a una pendiente más alta, en 
este y otros experimentos, la tasa sube durante un corto espacio de 
tiempo por encima de su valor posterior de tal forma que extrapolan- 
do hacia atrás desde la curva estable final a menudo se alcanza el punto 
en que se cambió el reforzamiento. Esto es lo que sucede en la figu- 
ra 42. Es como si el cambio de tasa hubiera sido instantáneo y como 
si la incapacidad de la tasa para subir correctamente durante los tres 
O cuatro primeros intervalos fuera compensada durante el quinto y el 
sexto. Es conveniente comparar dicha figura con los registros de mues- 
tra de la vuelta al recondicionamiento periódico después de la extinción 
de la figura 34 (pág. 145). 

En el otro tipo de registro diario obtenido bajo esas circunstancias 
la regularidad del cambio es destruida por repentinas depresiones de 
tasa. En la figura 43 presentamos un caso extraordinariamente agudo, 
correspondiente a una de las ratas de la figura 40, en que el intervalo 
era de ocho segundos. El segundo día del gráfico es el primer día en 
que se retardó el reforzamiento. Como se puede ver a partir de la fi- 
gura, la tasa empieza a declinar como en la figura 42, pero poco des- 
pués de la mitad de la hora desciende repentinamente a cero y allí 
permanece durante el resto del período. Al día siguiente la tasa empie- 
za a un valor bajo, pero presenta cierta aceleración durante la hora. Al 
tercer día se produce una nueva aceleración. 

En esta figura se ha trazado una línea curva discontinua para suge- 
rir el curso probable del registro en ausencia de una depresión repen- 
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tina de la tasa. Desde luego no bay razón para suponer que la acelera- 
ción compensatoria del cuarto día haya cesado en este momento y que 
en lo sucesivo la curva siga la extrapolación de la línea curva discon- 
tinua. Desgraciadamente, el plan del experimento no permitió seguir 
este camino lo bastante lejos para determinar la extrapolación de forma 
más precisa. Al día siguiente el reforzamiento fue de nuevo simultá- 
neo, y la rata reprodujo casi exactamente Su antigua tasa, habiendo 
emitido ya esta tasa al fin el cuarto día. El ejemplo de la figura 43 es 
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En la primera flecha se introdujo un intervalo de ocho segundos entre la respuesta 

y el reforzamiento. Treinta minutos más tarde la tasa descendió repentinamente a 

cero y se recobró sólo gradualmente durante los dos períodos diarios siguientes. 
En la segunda flecha el reforzamiento pasó de nuevo a ser simultáneo 


excepcionalmente raro, en lo que se refiere a su duración. Una repen- 
tina reducción a la tasa cero es bastante corriente, pero el efecto raras 
veces dura tanto. Generalmente, se produce un rápido restablecimiento. 

La naturaleza del efecto no está clara. Parece estar decididamente 
asociado con el procedimiento del reforzamiento retardado y es más 
probable que ocurra en los intervalos más largos. Su presencia hace 
que cualquier promedio de grupo sea de poco valor a la hora de de- 
terminar el curso del cambio de una tasa a otra. Tiende especialmente 
a enmascarar el descenso regular debido a la extinción, ya que toma 
respuestas de registros anteriores de la serie y las transfiere a partes 
ulteriores. Si promediáramos los registros de los días 2, 3 y 4 de las 
figuras 42 y 43, el resultado sería casi una línea recta, que no conten- 
dría ninguna indicación sobre uno u otro tipo de cambio. En la figu- 
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ra 40 los puntos del tercer. día de la gráfica son más bajos y los de los 
dos días siguientes más altos de lo que hubieran sido en ausencia de 
desviaciones. Así, pues, el descenso aparentemente brusco a una nueva 
tasa es ilusorio. 

En el experimento representado en la figura 41 los promedios del 
grupo muestran el resultado de la extinción, porque el efecto pertur- 
bador está ausente. Esto puede deberse al hecho de que, como el efecto 
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Las tasas empiezan bajas a causa de la extinción previa. No se desarrolla una tasa 

muy alta, ni siquiera con los intervalos más cortos y hay irregularidades considera- 

bles. Compárese con la figura 28 (página 134) en lo que respecta al reforzamiento 
no-retardado 


aparentemente ocurre sólo una vez en el caso de cada rata, y como las 
curvas de la figura 41 constituyen los promedios de tests repetidos, 
una desviación ocasional podría quedar fácilmente neutralizada. Pero 
no hay desviaciones similares que neutralizar. En este grupo, como ya 
he dicho, se introdujeron los intervalos los dos primeros días de re- 
condicionamiento periódico. En este caso, no cabría esperar una des- 
viación exactamente comparable a la descrita anteriormente, aunque 
sí podría suceder algo semejante. De hecho, sé produce una notable 
perturbación, como ya veremos en la figura 44, que presenta los regis- 
tros de esos dos días correspondientes a las cuatro primeras ratas del 
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grupo. Estas curvas pueden compararse con las de la figura 28 (pág. 134), 
empezando en B y B', con objeto de observar el efecto del intervalo. 
La tasa que se obtiene durante el intervalo se alcanza bastante rápida- 
mente, pero no es igual a la tasa observada al volver al intervalo 
después del reforzamiento simultáneo. Además, la “textura” del regis- 
tro es basta. La rata oscila entre períodos de respuesta rápida y lenta, 
y la misma tasa media raras veces se llega a emitir. Los cuatro registros 
presentan esta característica. En parte como consecuencia de sus valo- 
res subnormales las cuatro pendientes son del mismo orden, a pesar de 
la diferencia de intervalos. Todas las ratas presentaron una aceleración al 
día siguiente cuando el reforzamiento fue simultáneo por primera vez. 

Como consecuencia de este reforzamiento retardado inicial las des- 
viaciones repentinas halladas en el otro grupo no aparecen cuando el 
reforzamiento se retarda de nuevo. Por consiguiente, las curvas indivi- 
duales son semejantes a las de la figura 42, y la aceleración negativa 
viene claramente mostrada en el promedio del grupo (figura 41). 

El carácter de estas desviaciones anómalas hace posible atribuirlas 
a factores situados fuera del sistema que vamos a investigar inmediata- 
mente. Si prescindimos de ellos, podemos decir que la fuerza del reflejo 
pasa de un valor a otro de una forma que es acorde con descripciones 
previas de su estado y de los factores que determinan su estado. 

En vista de la presencia de respuestas debidas a la extinción en las 
tasas reducidas observadas con este método, debe suponerse que el des- 
censo en porcentaje dado para cada intervalo es algo menor que la 
plena expresión del efecto del intervalo. El efecto tiene que ser al 
menos tan grande como hemos indicado, y probablemente es mucho 
mayor. La incapacidad de desarrollar una tasa Superior cuando se in- 
troduce el intervalo al principio del procedimiento periódico (figura 44) 
es una prueba palpable en apoyo de esta conclusión. Es probable que 
el efecto de un retraso de ocho segundos sea una reducción de eficacia 


más bien del 100 % que del 50 2. 


Condicionamiento negativo y reforzamiento periódico 


El procedimiento del recondicionamiento periódico es también va- 
lioso al emprender el estudio del caso hipotético del “condicionamiento 
negativo” abordado en el capítulo anterior. En los experimentos que 
ahora vamos a describir, la forma del reforzamiento negativo usada fue 
la de una sacudida brusca administrada al pie o pies usados al apretar 
la palanca, producida por la misma palanca en el curso de la operación 
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de su pulsación. El aparato consistía en martillo doble accionado eléc- 
tricamente que se disparaba hacia arriba contra los dos ejes de la pa- 
lanca detrás del panel. La sacudida podía ser administrada u omitida 
a voluntad. Como quiera que una rata acciona la palanca con casi la 
misma fuerza cada vez, el efecto de la sacudida producida por el brusco 
movimiento ascendente de la palanca era relativamente constante y, 
por consiguiente, se prefirió a una descarga eléctrica, que es la forma 
más corriente de reforzamiento negativo. La única estimulación, además 
de la sacudida producida por el aparato, consistía en un chasquido 
bastante fuerte. 

El primer experimento se refiere al efecto del reforzamiento negati- 
vo sobre la extinción. Se obtuvieron curvas de extinción después del 
reforzamiento periódico con comida de cuatro ratas. Al tercer día se 
conectó el aparato administrador de sacudidas (slapper) por primera vez 
al cabo de veinte minutos del comienzo de la sesión, y todas las respues- 
tas emitidas durante el resto de la hora y durante el día siguiente fue- 
ron reforzadas negativamente. Al quinto día se desconectó el aparato, 
y al sexto y séptimo días la respuesta se reforzó de nuevo periódicamente 
con comida. 

Presentamos los resultados en la figura 45 (página 168). El primer 
efecto fue un fortalecimiento inmediato del reflejo. A la primera sacudida 
siguió rápidamente una segunda respuesta, y durante los dos o tres minu- 
tos siguientes se observó una respuesta relativamente rápida frente al re- 
forzamiento negativo. En algunos experimentos exploratorios hallamos 
que una segunda respuesta rápida era la regla general. En dichos expe- 
rimentos se administró una sacudida lo bastante fuerte como para pro- 
ducir un violento brinco del animal, y en general en ellos se observó 
claramente un fortalecimiento inicial del reflejo. Esta fase fue segui- 
da por una supresión prácticamente completa. Al día siguiente, sólo 
ocurrieron algunas respuestas aisladas, las cuales fueron reforzadas ne- 
gativamente de la forma indicada. Al próximo día (día 6 de la figura) no 
se reforzó negativamente ninguna respuesta, pero no obstante se man- 
tuvo una tasa muy baja. Cuando más tarde se recondicionó la respuesta, 
la tasa subió mucho como en el recondicionamiento periódico original. 
En la figura 46 damos una serie de registros individuales de este 
experimento. En la figura 45 los números se refieren a los días. 

La figura 45 sugiere que la sacudida ocasionó una reducción del 
tamaño de la reserva del reflejo, tal como cabría esperar si hubiera un 
proceso de condicionamiento negativo exactamente opuesto al del con- 
dicionamiento positivo, en que cada reforzamiento negativo sustrajera 
una serie de respuestas de la reserva. De acuerdo con este punto de 
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vista la tasa baja del último día de la extinción, cuando no había refor- 
zamiento negativo, era debida al agotamiento de la reserva y era com- 
parable con la tasa a un estadio muy posterior de la extinción ordinaria. 
Ya veremos en los experimentos siguientes que esta conclusión es injusti- 
ficada y que un estadio emocional condicionado es probablemente 
responsable, en ese experimento, de la supresión de la actividad en el 
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Erecro DEL REFORZAMIENTO NEGATIVO SOBRE LA CURVA DE EXTINCIÓN 


La curva de extinción es la línea continua. Se indica la parte de la misma durante 

la cual todas las respuestas recibieron una sacudida, Hay un restablecimiento escaso 

o nulo el último día de la extinción sin sacudidas. Las líneas punteadas dan las 
pendientes bajo reforzamiento periódico 


último día de la extinción. La presente interpretación no es concluyente 
por dos razones: 1) el uso del aparato fue tan prolongado que el estado 
emocional pudo condicionarse de una manera casi máxima, y 2) las 
respuestas que ocurrieron en el último día sin la sacudida fueron dema- 
siado escasas para permitir una extinción adecuada de este efecto. 

En un experimento en que el reforzamiento negativo fue breve y la 
posibilidad de la extinción de un efecto emocional se vio incrementada, 
no se descubrió reducción alguna de la reserva. Dos grupos de cuatro 
ratas cada uno con ninguna experiencia en el aparato administrador 
de sacudidas fueron recondicionados periódicamente durante tres días. 
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Seguidamente se extinguió el reflejo en ambos grupos durante dos horas 
en cada uno de los dos días sucesivos. En uno de los grupos todas las 
respuestas recibieron sacudidas durante los diez primeros minutos del 
primer día. 


TIEMPO EN MINUTOS 


Ficura 46 


SERIE DE REGISTROS DE UNA RATA DE LA FIGURA 45 


Presentamos el resultado en la figura 47. El efecto de la sacudida 
en el sentido de hacer descender la tasa es evidente, pero también está 
fuera de toda duda la existencia de un restablecimiento pleno cuando 
se mantiene el reforzamiento negativo. Al finalizar el segundo día, los 
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dos grupos habían emitido prácticamente el mismo número medio de 
respuestas. Al comparar los grupos de esta forma deben tenerse en cuenta 
sus razones de extinción, pero de las razones mostradas durante los días 
anteriores a la extinción no se desprende ninguna explicación del pre- 
sente resultado. La razón del grupo que recibió sacudidas fue en casi 
un 25% inferior a la del grupo que no recibió sacudidas. En ausencia de 
todo reforzamiento negativo, el grupo que recibió sacudidas debiera 
de haber dado una curva de extinción inferior, El hecho de que se 
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Ficura 47 
EFECTO DEL REFORZAMIENTO NEGATIVO SOBRE LA EXTINCIÓN 


Las dos curvas corresponden a grupos de cuatro ratas cada uno, con la misma 

historia experimental. Todas las respuestas emitidas por un grupo durante los diez 

primeros minutos de extinción recibieron una sacudida. La tasa disminuye durante 
algún tiempo, pero al final se produce un restablecimiento completo 


alcanzara la misma altura, por consiguiente, es tanto más significativo; 
en realidad, podría sostenerse que el efecto de la sacudida fue el de 
aumentar la reserva. 

La figura 47 debe inducirnos a revisar la conclusión basada sobre 
la figura anterior. Es cierto que hay una supresión temporal de res- 
puestas, pero todas las respuestas originalmente en la reserva surgen 
al fin sin un nuevo reforzamiento positivo. Este efecto es, por definición, 
de carácter emocional. Es un efecto sobre la relación existente entre la 
reserva y la tasa, y no sobre la misma reserva. En este experimento no 
hay prueba de ninguna clase en favor de un proceso de condiciona- 
miento negativo que sea precisamente todo lo contrario del condiciona- 
miento positivo. La conducta de la rata, por otra parte, está completa- 
mente de acuerdo con el supuesto de que la sacudida establece un estado 
emocional de tal suerte que toda conducta asociada con la alimenta- 


170 


ción quede suprimida temporalmente y que al fin la misma palanca y 
los movimientos incipientes de apretarla, se conviertan en estímulos 
condicionados capaces de evocar el mismo estado. El efecto no se mos- 
tró de manera clara en la figura 45 por razones que ya hemos dado. 

Una segunda forma de comprobar si una acción reforzadora negativa 
reduce el tamaño de la reserva consiste en interpolar reforzamientos 
negativos durante el reforzamiento positivo periódico. Por ejemplo, 
supongamos que la respuesta sea reforzada con comida cada cuatro 
minutos y que se obtenga el valor de la razón de extinción. Luego se 
administran reforzamientos negativos y positivos alternativamente cada 
dos minutos de tal forma que la frecuencia de los reforzamientos posi- 
tivos siga siendo la misma que antes, al tiempo que se administre tam- 
bién un número igual de reforzamientos negativos. Si el reforzamiento 
negativo tiene un efecto sobre la reserva, la diferencia entre la tasa 
resultante y la predominante bajo el reforzamiento positivo solo, debiera 
permitir el cálculo del número de respuestas sustraídas por un solo 
reforzamiento negativo. 

En la figura 48 A (página 172) representamos tres experimentos, cada 
uno de ellos sobre cuatro ratas. La media resultante (línea gruesa) es 
representativa de los casos individuales. Los puntos de los dos primeros 
días dan las tasas por hora bajo reforzamiento periódico positivo a inter- 
valos de cuatro minutos. En los cuatro días siguientes se alternaron las 
sacudidas con gránulos cada dos minutos (recibiendo así la rata gránulos 
cada cuatro minutos). Hay un significativo descenso de tasa que afecta 
sólo al segundo día de reforzamiento negativo. Al séptimo día del expe- 
rimento las respuestas no recibieron sacudidas, pero la tasa no cambió 
apreciablemente. 

Si hay un efecto reforzante negativo real que quede revelado en este 
experimento, dicho efecto no es permanente. La única reducción aparen- 
te se sitúa en el segundo día. Podría aducirse que una reducción seme- 
jante en el primer día quedó disimulada por un fortalecimiento temporal 
que es el primer resultado del reforzamiento negativo, y que durante 
los dos días se obtuvo una reducción de la reserva. Pero la reducción 
repentina de la tasa bajo recondicionamiento periódico no es el resultado 
que cabe esperar de una reducción de la reserva. El descenso de tasa 
debe ser gradual, especialmente a partir del momento en que se espa- 
ciaron los reforzamientos negativos. Por otra parte, el resultado se ajusta 
a la hipótesis de un efecto emocional que se adapte característicamen- 
te a medida que el experimento progresa. La sacudida no es un estímulo 
muy nocivo y cabe esperar la adaptación. El porqué no hay compensa- 
ción por la reducción del input del segundo día es difícil de decir, a 
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menos que supongamos que la compensación solamente ocurre dentro 
de un espacio de tiempo razonablemente breve y que no puede mante- 
nerse a lo largo de veinticuatro horas. Puede aducirse otra explicación 
a partir de la presencia de una tasa reducida debida al descenso del 
impulso. Como indicaremos en el capítulo 11, la emoción y el impulso 


O = SiN SACUDIDAS 


0 =» POR CADA 
RESPUESTA REFORZADA  D 
CON COMIDA, UNA (O MAS R 
TAL COMO SE INDICA) 


RECIBIO UNA SACUDIDA 


(5) TODAS 


TODAS 


RESPUESTAS POR HORA 


DÍAS 


Ficura 48 


EFECTO DEL REFORZAMIENTO NEGATIVO SOBRE LA TASA DURANTE EL REFORZAMIENTO 
PERIÓDICO CON COMIDA 


constituyen fenómenos estrechamente relacionados, pero también mos- 
traremos en el capítulo 10 que una tasa reducida debida a un descenso 
del impulso no se ve compensada posteriormente. 

La curva B de la figura 48 constituye una nueva prueba de que, al 
menos eventualmente, no se experimenta ninguna reducción de la razón 
de extinción como resultado del reforzamiento negativo. Dos de los 

. . 14 se . E 
grupos de la curva A se extinguieron después del último día que consta 
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en la figura y posteriormente se reforzaron periódicamente con comida. 
El segundo día de este recondicionamiento aparece como el día 1 de la 
curva B. Cuando se interpolaron de nuevo reforzamientos negativos, se 
experimentó un efecto escaso o nulo (días 2 y 3). Cuando se aumenta- 
ron las sacudidas hasta un número de tres cada cinco minutos, se pro- 
dujo un ligero incremento de tasa. Más tarde se administraron cinco 
reforzamientos negativos cada cuatro minutos, y al final todas las res- 
puestas recibieron una sacudida, mientras las ratas recibían periódica- 
mente la comida como antes. En la tasa no se observa ningún efecto 
significativo. Cuando se omitieron por completo las sacudidas, se pro- 
dujo una reducción de la tasa; cuando todas las respuestas recibieron de 
nuevo una sacudida, la tasa se incrementó rápidamente. 


En resumen, los experimentos sobre condicionamiento negativo pe- 
riódico muestran que toda verdadera reducción de reserva es en el mejor 
de los casos temporal y que el efecto emocional que cabe esperar de 
una estimulación de este tipo puede explicar adecuadamente el debili- 
tamiento temporal del reflejo realmente observado. 


Puede afirmarse que, aun cuando el tamaño de la reserva no se vea 
afectado por los estímulos “negativamente reforzantes”, la accesibilidad 
de las respuestas que contiene puede verse modificada. Todo cam- 
bio de este tipo de accesibilidad debiera revelarse en una curva de 
extinción después del reforzamiento negativo. Para comprobar esta posi- 
bilidad se extinguió el reflejo después de los días mostrados en la fi- 
gura 48 A. Hay que señalar que el día antes de la extinción las res- 
puestas no recibieron ninguna sacudida ni tampoco ello sucedió durante 
la extinción. La curva se registró durante dos horas. Las alturas medias 
de las ocho curvas medidas cada diez minutos vienen dadas en la fi- 
gura 49, La curva responde a la ecuación : 


+35+05 té 


N = 108 log 


que es el mismo tipo de ecuación usado para describir la extinción y la 
discriminación simples. Aquí la ecuación se aplica a la conducta de las 
ratas durante un solo período experimental. Aunque la correspondencia 
no es perfecta, quizás estamos autorizados a concluir que, a pesar del 
reforzamiento negativo precedente, la reserva se presenta para la emi- 
sión esencialmente de la misma forma. 


Otra oportunidad para usar la curva de extinción con objeto de 
comprobar una reducción de reserva se nos presenta cuando se ha adap- 
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tado el estímulo negativamente reforzante. En el experimento siguiente 
veremos que el proceso de extinción prosigue impasible aun cuando 
son reforzadas negativamente todas las respuestas. En la figura 50 da- 
mos curvas de extinción después de recondicionamiento periódico para 
dos grupos de cuatro ratas cada uno que tienen la misma historia en 
cuanto a la adaptación para recibir sacudidas. Durante los cuatro y 
medio primeros períodos diarios todas las respuestas emitidas por un 
grupo fueron reforzadas negativamente y todas las respuestas emitidas 
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FIGURA 49 
EXTINCIÓN DESPUÉS DE REFORZAMIENTO NEGATIVO PERIÓDICO 
La extinción dio comienzo el día siguiente al último día de la figura 48 A 


por el otro no lo fueron. El grupo que recibió sacudidas muestra un 
descenso de tasa algo más lento, que es probablemente atribuible no a 
las sacudidas, sino a la mayor razón de extinción media de este grupo. 
Poco antes de la mitad del quinto periodo se invirtió la administración 
de sacudidas, y se registró un sexto día bajo las mismas condiciones al- 
teradas. El único resultado significativo del cambio fue un ligero incre- 
mento de tasa del grupo que originalmente no recibió sacudidas. Cierta 
supervivencia de la fase emocional inicial de fuerza incrementada po- 
dría explicar este aumento, y en general, parece justificada la conclusión 
de que el reforzamiento negativo sostenido de la respuesta no surtió 
efecto alguno sobre la reserva. 

Al interpretar todos los resultados anteriores debemos recordar que 
el estímulo negativamente reforzante era muy débil. Las figuras 45 y 47 
muestran sin lugar a dudas que surtió un claro efecto, pero dicho efec- 
to no debe considerarse como necesariamente comparable con un es- 
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tímulo tal como una fuerte descarga eléctrica. El hecho de si un estímulo 
más fuerte hubiera ocasionado realmente una reducción de la reserva 
atribuible a un verdadero condicionamiento negativo debe ponerse en 
duda. Sería extraño que un leve reforzamiento negativo no mostrara 
algún signo de reducción de la reserva en una prueba tan delicada como 
la que supone la extinción o el recondicionamiento periódico si un 
estímulo más fuerte así lo hiciera, El estímulo más fuerte, sin embargo, 
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Las curvas corresponden a dos grupos con la misma historia experimental. Se admi- 
nistraron sacudidas a todas las respuestas que se indican, con muy poco efecto 
sobre la curva 


podría neutralizar el efecto generando un efecto emocional más fuerte 
y duradero, con poca probabilidad de adaptación con el transcurso del 
tiempo. 


El uso de un reforzamiento negativo constituye otro caso de reduc- 
ción de la fuerza del reflejo en el que a menudo se invoca el término 
“inhibición”. La imposibilidad de emitir una fuerte respuesta a causa 
de un reforzamiento negativo previo es tal vez el caso más común al 
que se aplica vulgarmente el término “inhibición”. Si la interpretación 
precedente es correcta, el efecto debe clasificarse como una reacción 
emocional condicionada, comparable con la supresión de la conducta 
de comer por parte de un estímulo “atemorizante”, excepto que en el 
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presente caso el estímulo que suscita el estado emocional resulta ser tam- 
bién el estímulo discriminativo externo del que depende la ejecución de 
la respuesta. La naturaleza de dicha reacción emocional y su relación 
con la inhibición, definidas en el capítulo 1, serán tratadas en el ca- 
pítulo 11. 

La distinción entre el debilitamiento de un reflejo mediante el ago- 
tamiento de la reserva y el debilitamiento mediante una modificación 
emocional de la relación existente entre la reserva y la fuerza, consti- 
tuye evidentemente la distinción entre el mero “olvido” o “pérdida de 
interés” y una “represión” activa. 


El efecto emocional de un “estímulo negativamente reforzante” en 
el tipo R nos da otra explicación de la imposibilidad ocasional de ob- 
tener un condicionamiento instantáneo discutida en el capítulo anterior. 
Si la estimulación táctil y auditiva procedente del movimiento hacia aba- 
jo de la palanca resulta negativamente reforzada en este sentido, dos 
efectos siguen a la primera respuesta: el reforzamiento positivo de la 
comida, tendente a incrementar la fuerza de la respuesta, y el efecto 
negativo del movimiento, tendente a hacerla disminuir. El resultado 
neto puede ser sólo un efecto positivo moderado o incluso ningún efec- 
to en absoluto. La compensación posterior y la adaptación del estímulo 
negativo admiten un aumento eventual de la fuerza. 


La correlación negativa entre la respuesta y el reforzamiento 


Volvemos al efecto de un intervalo de tiempo entre la respuesta y 
el reforzamiento. Con el incremento de la duración del intervalo el efec- 
to del reforzamiento debiera desaparecer en algún punto, y cuando la 
duración se ha llevado hasta su extremo práctico es posible que se ob- 
serve un efecto opuesto. Entonces habría una correlación negativa entre 
la respuesta y el reforzamiento. La posibilidad de que pueda reforzar- 
se la “no-respuesta” merece consideración. La noción de condicionar un 
organismo a no-responder no debe confundirse con el condicionamiento 
negativo (en que una respuesta es seguida por un reforzamiento nega- 
tivo) ni tampoco con aquel tipo de discriminación temporal en que se 
refuerza una respuesta si no ha sido precedida por otra respuesta du- 
rante un cierto período de tiempo. El condicionamiento a “no-respon- 
der” es posiblemente una manera distinta e importante de reducir la 
reserva. No es difícil diseñar un experimento adecuado, pero nadie toda- 
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vía lo ha hecho. Éste podría consistir en comparar dos series de curvas 
de extención (obtenidas preferentemente después de recondicionamiento 
periódico) en una de las cuales se reforzarán los intervalos de no-res- 
puesta. Podría reforzarse cada intervalo tan pronto como alcanzara una 
duración requerida o bien, si esto amenazara con entrañar un cambio de 
impulso al suministrar demasiada comida, podrían reforzarse los inter- 
valos de la forma más periódica posible. La existencia del condiciona- 
miento a “no-responder” sería probada por una reducción de la altura 
de las curvas de extinción correspondientes al grupo que recibe el re- 
forzamiento, lo cual indicaría que la reserva del reflejo de este grupo 
había quedado reducida. 

En la figura 51 presentamos un experimento en que el intervalo se 
aproximaba, o casi alcanzaba, un valor que producía condicionamiento 
a no-responder. El registro fue tomado tras un prolongado recondicio- 
namiento periódico. El día del experimento se administraron perió- 
dicamente a la rata gránulos de comida, pero nunca en el intervalo de 
los 15 segundos transcurridos después de la respuesta. El intervalo me- 
dio fue mucho mayor de quince segundos, en particular hacia el final 
del experimento. Ya veremos que la correlación negativa provoca un 
rápido descenso de la tasa, a saber, de unas doce respuestas por minuto 
al principio a una por minuto al cabo de una hora y cuarto. Al día si- 
guiente se produjo un considerable restablecimiento. A pesar de la 
brevedad del intervalo, este caso casi se acerca al límite práctico. Es 
imposible decir cuándo va a finalizar una pausa. No podemos reforzar 
tan pronto como la rata empieza a responder, porque ello supondría 
reforzar el movimiento de partida; por ello, no podemos sacar provecho 
de intervalos largos ocasionales. Debemos establecer ciertas reglas, como 
la del presente caso: reforzar periódicamente, con tal que la rata no 
haya respondido dentro de cierto período de tiempo, o esperar a 
que haya transcurrido un intervalo de dicha duración. Si la rata responde 
a una tasa bastante alta, sin embargo, no puede lograrse la frecuencia 
deseada de reforzamiento periódico con un intervalo mucho mayor de 
quince segundos. 

Este experimento difiere fundamentalmente del consistente en in- 
troducir simplemente un largo intervalo entre las respuestas y el refor- 
zamiento, en que el reforzamiento es contingente al intervalo, pero tam- 
bién a la respuesta anterior. En el presente caso la rata podría dejar de 
responder por completo, pero no obstante el almacén seguiría suminis- 
trando periódicamente gránulos de comida. El caso del intervalo se 
aproxima al de la correlación negativa cuando el experimento se realiza 


177 


con ratas que ya han estado respondiendo bajo recondicionamiento pe- 
riódico. La diferencia sería más marcada si ambos procedimientos se 
adoptaran en el condicionamiento original. Bajo las condiciones de la 
correlación negativa no se produciría ningún tipo de condicionamiento 
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PALANCA 


positivo. Si la rata no estuviera ya respondiendo a la palanca con cierta 
fuerza incondicionada, nunca llegaría a hacerlo debido a este procedi- 
miento. Por otra parte, cuando el condicionamiento original depende 
de la provocación de una respuesta más una pausa, el condicionamiento 
tiene lugar con tal que la pausa no sea demasiado larga (ver capítulo 3). 
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Ausencia de correlación entre la respuesta y el reforzamiento 


En el experimento anterior cuya condición esencial era la correla- 
ción negativa entre la respuesta y el reforzamiento, podríamos decir (en 
lenguaje corriente) que la rata aprende a no apretar la palanca porque 
la administración periódica de comida resulta depender de una ausen- 
cia de respuestas. Ahora consideraremos un caso algo semejante, en el 
que no hay ninguna correlación, ni positiva ni negativa, entre la res- 
puesta y el reforzamiento. La rata responde de acuerdo con cualquier 
fuerza previamente establecida, pero la administración periódica de 
gránulos está regulada por un mecanismo de relojería, y sólo hay una 
relación temporal accidental entre un reforzamiento dado y una res- 
puesta o la ausencia de una respuesta. Como los reforzamientos aisla- 
dos son eficaces, la tasa resultante debe fluctuar, en cierta medida, al 
azar. Pero el efecto medio no guarda ninguna correlación y en última 
instancia la conducta de la rata debe reflejar este hecho. Hablando 
vulgarmente, la rata debe aprender que su respuesta no tiene relación 
alguna con la administración periódica de comida. 

Se realizó un experimento para descubrir el efecto de la transición 
del reforzamiento periódico a la administración de comida periódica e 
independiente utilizando cuatro ratas de 120 días. La operante se con- 
dicionó de la forma usual, y el recondicionamiento periódico se inició 
al día siguiente. Se encontró que un intervalo de cinco minutos produ- 
cía una tasa extraordinariamente elevada con este grupo, y en el se- 
gundo día y siguientes se procedió a cambiar a seis minutos. Tras tres 
días de recondicionamiento periódico se operó el almacén a la misma 
frecuencia, pero de forma completamente independiente de la conducta 
de la rata en el tiempo. El gránulo de comida reforzaba una respuesta, 
o no, según la conducta momentánea de la rata. Se mantuvo este pro- 
cedimiento durante nueve días, y al décimo se correlacionó de nuevo 
el reforzamiento con una respuesta periódica. 

La manera en que la rata “aprende que la administración de la co- 
mida no guarda relación alguna con su respuesta” viene mostrada en 
la figura 52, que da las tasas medias del grupo desde el tercer día hasta 
el final del experimento. La tasa inicial bajo recondicionamiento perió- 
dico fue ligeramente menor de 300 respuestas por hora. Inmediatamen- 
te después de suprimir la correlación entre el reforzamiento y la res- 
puesta (el segundo día del gráfico) la tasa disminuyó. El primer día 
quedó reducida en un tercio. Este resultado podía preverse a partir del 
experimento anterior al introducir un intervalo de tiempo entre la res- 


179 


puesta y el reforzamiento. La tasa siguió descendiendo durante dos o 
tres días, pero luego se estabilizó en casi un cuarto de su valor original. 
No hay ninguna indicación durante el período del experimento de que 
la rata dejara al fin de responder, aun cuando todas las respuestas en 
realidad eran inútiles. Cuando se restableció la correlación (el undéci- 
mo día del gráfico), la tasa subió inmediatamente hasta casi su valor 
original, siendo evidente la ligera fluctuación descendente de costumbre. 

La explicación de la incapacidad para dejar de responder es proba- 
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blemente la siguiente: El intervalo medio entre una respuesta y un re- 
forzamiento viene determinado por la tasa de respuesta dominante en 
aquel momento, como también lo está, por esta razón, su efecto medio 
al reforzar el acto de responder o, posiblemente, el de no responder. 
Cuando la tasa casi se acerca a cero, como antes del condicionamiento, 
el intervalo medio es largo, y está ausente el efecto o bien se produce 
en el sentido de reforzamiento a no-responder. (No podemos suponer 
que la presentación de un estímulo reforzante no surte efecto alguno.) 
La rata no será condicionada a apretar la palanca bajo este procedimien- 
to de administración periódica de un estímulo reforzante si tiene sólo 
esta tasa incondicionada baja al empezar. Pero cuando se ha establecido 
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previamente una tasa alta, como en el experimento presente, el intervalo 
medio es de un orden diferente, y debe suponerse que la administra- 
ción completamente independiente de comida tiene un efecto reforzante 
considerable, aunque accidental. La estabilización a una tasa de una a 
dos respuestas por minuto observada en este experimento es, posible- 
mente, debida al hecho de que la proximidad ocasional de una respues- 
ta a la administración de comida de que es responsable dicha tasa casi 
basta para mantener la tasa. Con una razón de extinción de 20:1 bas- 
tarían tres coincidencias por hora, aunque lo que se obtendría en reali- 
dad es su equivalente en un número mayor de coincidencias menos 
perfectas. El hecho de si debemos recurrir a un input lo bastante gran- 
de como para tener en cuenta la sustracción debida al condicionamiento 
a no-responder debe seguir siendo una cuestión abierta hasta que este 
último fenómeno haya sido investigado. 

Así, pues, el experimento muestra que si la tasa empieza a un valor 
alto, no alcanza el valor cero porque no puede pasar a través de un 
punto en que el reforzamiento accidental es suficiente para mantenerla. 
La rata nunca puede aprender “que no hay relación alguna entre sus 
respuestas y la administración de comida”. Al hacer esta afirmación no 
estoy admitiendo el carácter aleatorio del experimento. Dado un período 
favorable falto de coincidencias, la tasa podría descender hasta un valor 
en que las coincidencias fueran cada vez menos probables y al fin al- 
canzaran un punto cero. 

Un experimento de este tipo no puede realizarse con éxito con ratas 
que han empezado a mostrar la discriminación temporal de tercer or- 
den descrita anteriormente (pág. 141). La concentración resultante de 
respuestas hacia el fin de cada intervalo eleva significativamente la pro- 
babilidad de reforzamiento coincidente y vicia el resultado. 


Recondicionamiento periódico de una respondiente 


Aunque he escrito enteramente este capítulo pensando en la con- 
ducta operante, también puede recondicionarse periódicamente una 
respondiente y, generalmente, así sucede en la naturaleza. Su fuerza 
se conducirá presumiblemente de la misma forma, aunque los dos ca- 
sos no son exactamente paralelos. En una respondiente se produce una 
modificación de la intensidad de la respuesta con un cambio de fuerza. 
El concepto de tasa de respuesta carece de validez, y las nociones de 
número de respuestas y de razón de extinción, por tanto, carecen de sen- 
tido. Pero dada una tasa constante de presentación del estímulo condi- 
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cionado (S*) con una correlación periódica del estímulo reforzante (S), 
puede alcanzarse un estado estable similar. Si se presentaran estímulos 
a intervalos de un minuto como sigue: S*+ Si S%, So, So, So + S! So, 
So, S”, 5 + S! ..., las magnitudes de las respuestas a todas las presenta- 
ciones aisladas de $”, al principio, deberían mostrar una tendencia ha- 
cia la extinción entre presentaciones de S, pero er la presente analogía 
finalmente tendrían que adoptar un valor estable intermedio. Podría 
utilizarse un valor constante de la misma forma que una razón de ex- 
tinción al estudiar el efecto de una condición de reforzamiento dada 
(por ejemplo, el efecto de un retraso). Sería interesante saber si la curva 
de extinción (que generalmente es irregular en este caso) presentaría 
una suavidad progresiva después de recondicionamiento periódico. 
La correlación negativa de S* y S! en una respondiente tendría la 
forma de la presentación de un estímulo reforzante en ausencia de $ 
y en ausencia de presentación en su presencia. Aquí cabría esperar un 
resultado diferente, al menos en el caso extremo en que S* fuera pre- 
sentada más o menos continuamente durante breves períodos de tiempo. 
Entonces aparecería una respuesta positiva en el momento de la cesa- 
ción de S* (Pavlov). El caso de ausencia de correlación no podría tener 
en absoluto la forma de una presentación al azar de S* y S' conjunta- 
mente, siendo accidental cualquier coincidencia. Una vez más, a dife- 
rencia del caso de la operante, seguramente surgiría un reflejo condi- 
cionado, aun cuando el procedimiento se estableciera al principio, 
porque $” formaría parte de la situación experimental a la que siempre 
el valor condicionado queda unido en un condicionamiento de este tipo. 
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5. La discriminación 
de un estímulo 


Naturaleza del problema 


Los diferentes estados de fuerza y cambios de fuerza descritos en 
los capítulos anteriores eran debidos a los diferentes modos en que pue- 
de correlacionarse un estímulo reforzante con una respuesta o con otro 
estímulo. Los casos que presentamos no han sido pocos ni simples, pero 
no han agotado el tema del reforzamiento como operación o de su efec- 
to sobre la conducta. Otro tipo de correlación plantea un problema en- 
teramente nuevo. Se trata de la correlación de un reforzamiento con un 
estímulo o respuesta que posea una propiedad específica. Dicha corre- 
lación no puede representarse plenamente por una sola provocación re- 
forzada o ni siquiera por la repetición de un solo reforzamiento. Por 
ejemplo, la presentación de comida como estímulo reforzante puede 
correlacionarse con el sonido de un tono dado, pero no con otros soni- 
dos, mas la presentación repetida del sonido juntamente con la comida 
no establecerá un reflejo condicionado que muestre esta correlación res- 
tringida, porque los tonos próximos también adquieren la propiedad de 
provocar la salivación mediante la “inducción” (capítulo 1). La conduc- 
ta puede llegar a seguir la relación real más o menos precisamente por- 
que una correlación con un sonido de un tono dado implica que los 
sonidos de otros tonos ocurren a veces, pero las respuestas hechas ante 
su presencia se extinguirán bajo los términos de la correlación reforzan- 
te. Al final el organismo responde al tono elegido y no a los otros, dentro 
de ciertos límites. El proceso a través del cual esto se consigue se llama 
discriminación. El ejemplo dado es uno de los tres tipos posibles a los 
que consagraremos los tres capítulos siguientes. 

El proceso de la inducción que origina el problema de la discrimi- 
nación fue descrito en el capítulo 1 con la ley siguiente: un cambio en 
la fuerza de un reflejo puede ir acompañado por un cambio similar, 
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pero no tan extenso en un reflejo condicionado con él, cuya relación 
estriba en la posesión de propiedades comunes en el estímulo o en la 
respuesta. Los cambios dinámicos a los que la inducción se aplica son 
aquellos en que la operación implica la provocación del reflejo, a saber, 
la fatiga del reflejo, el condicionamiento y la extinción. Estas operacio- 
nes también afectan a la reserva, y más tarde ya veremos que este hecho 
es importante. El presente capítulo se refiere a la inducción debida a 
la semejanza de estímulos. El problema general es el siguiente: Al es- 
tablecer la correlación de un estímulo específico (por ejemplo, una des- 
carga eléctrica de una fuerza dada aplicada a un punto dado de la 
pierna) con una respuesta (por ejemplo, la flexión de la pierna en una 
dirección dada), no puede decirse que se haya establecido una unidad 
aislada. La unidad obedecerá las leyes que se aplican a ella experimen- 
talmente tratada, pero no se encontrará necesariamente desconectada 
del resto de la conducta del organismo. Podemos establecer una serie 
de reflejos de flexión que difieren en sus puntos de estimulación y en 
su dirección de la flexión que, en tanto nos interesamos simplemente 
por la correlación, podemos considerar como unidades separadas. Sin 
embargo, al examinar un cambio dinámico como la fatiga veremos que 
una operación realizada sobre una de ellas afecta también a las otras, 
seguramente con arreglo a la proximidad de los estímulos (Sherring- 
ton). En el capítulo 1 vimos que esto estaba íntimamente relacionado 
con el problema de la definición de una unidad. El problema se plantea 
porque los estímulos pueden, generalmente, ordenarse en un orden con- 
tinuo, como en el caso del continuum espacial en el caso del reflejo 
de flexión, en que los miembros adyacentes difieren sólo ligeramente. 
En las respondientes incondicionadas controlamos los estímulos, y por 
consiguiente los fenómenos de inducción surgen como simples interac- 
ciones y pueden describirse como tales. De acuerdo con esta concepción 
denominaré un reflejo a cada correlación aislable experimentalmente y 
trataré a todo grupo de reflejos que muestre una interacción inductiva 
simplemente como un grupo. 

La inducción plantea un problema especial en que los reflejos con- 
dicionados en que el reforzamiento está correlacionado con un estímulo 
o una respuesta que presenta una propiedad especial. Es imposible, 
desde el punto de vista de la inducción, que la conducta refleje preci- 
samente esta correlación sin necesidad de recurrir a la extinción. Si se 
correlaciona la presentación de comida sólo con la presentación de un 
sonido de un tono especial, el reforzamiento condicionará las respuestas 
a los sonidos de otros tonos con los que no hay en realidad ninguna 
correlación de comida. Cuando esos sonidos se presentan más tarde, ne- 
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cesariamente resulta la extinción. De esta forma llegan a atribuirse di- 
ferentes fuerzas a reflejos íntimamente relacionados, contrarios al efec- 
to natural de la inducción. Este proceso de discriminación surge de la 
correlación restringida del estímulo reforzante. El organismo “genera- 
liza” el efecto del reforzamiento a través de la inducción, pero las con- 
diciones externas de la correlación no son capaces de sostenerlo. 

En la discriminación de un estímulo tenemos en el caso más simple 
dos reflejos que difieren con respecto a una propiedad de sus estímulos. 
Pongamos que l representa la propiedad o valor elegido de una propie- 
dad con los que el reforzamiento está correlacionado, y A, la ausencia 
de esta propiedad o algún otro valor de ella en un continuo. El obje- 
to de la discriminación es dar a SI. R una fuerza significativa mantenien- 
do al mismo tiempo a SA.R a una fuerza muy baja o preferiblemente a 
cero. Primero reforzamos Sl. R, pero (SA. R) también aumenta. (El pro- 
ceso puede empezar con ambos reflejos con fuerzas iguales si ambos 
han sido reforzados previamente. En tal caso la discriminación empieza 
cuando el reforzamiento se retira primero de SA.R tras habérselo dado 
previamente.) El próximo movimiento es extinguir SA.R, pero Sl.R 
también disminuye en fuerza. Si luego recondicionamos S!.. R, SA. R tam- 
bién incrementa su fuerza. Y así sucesivamente. El proceso no es fútil 
porque en cada caso el efecto inducido es algo menor que el directo, y 
los dos reflejos tienen fuerzas separadas. Cada movimiento simultáneo 
hacia abajo es menos extenso para Sl. que para SA.R y cada movi- 
miento hacia arriba menos para SA. R que para Sl. R. Repitiendo con- 
dicionamientos y extinciones alternativos podemos acumular las ligeras 
diferencias que ocurren en las distintas ocasiones. 

Vulgarmente hablando, una discriminación del estímulo es un pro- 
ceso por el que un organismo “dice cuál es la diferencia entre dos es- 
tímulos” o al menos “dice que son diferentes”. Esta concepción se ha 
afianzado con firmeza en psicología a causa de la importancia de la 
discriminación en el estudio de los procesos sensoriales y en especial 
de los umbrales. Pero es de poco valor aquí. Puede afirmarse que un 
organismo “dice que dos estímulos son diferentes” si puede detectarse 
cualquier diferencia en su conducta con respecto a ellos. De la natu- 
raleza de la inducción (y especialmente de su dependencia de la pro- 


1. Es elíptico, pero conveniente, hablar de la correlación entre un estímulo 
reforzante y el valor de una propiedad singular. Ello no implica que la propiedad 
tenga el status de un estímulo. Un organismo no responde a un tono, sino a un 
tono de una agudeza determinada. La correlación del estímulo reforzante se efectúa 
siempre con un tono, no con una propiedad aislada. De acuerdo con esta acepción 
no podemos hablar de propiedades singulares (por ejemplo, “rojo” o “la bemol”) 
como de “estímulos”. 
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ximidad) puede inferirse que eso es lo que inevitablemente sucede en 
cualquier diferencia supraliminar, aunque nuestra medida no sea bas- 
tante precisa para detectar el efecto cuando la diferencia es casi limi- 
nar. Lo que se llama “aprender a decir cuál es la diferencia” en este 
caso es el aumento de la diferencia de fuerza en los reflejos relaciona- 
dos a través del condicionamiento y la extinción alternativos. Esto no 
es una forma de condicionamiento. Hacer uma discriminación es acu- 
mular leves diferencias que constituyen de suyo propiedades de la con- 
ducta original del organismo. Si es posible o no reducir la cantidad de 
inducción existente entre dos reflejos para así apresurar su separación 
de fuerzas será considerado más tarde. En tal caso el término “discri- 
minación” podría referirse a la descomposición de la inducción, pero 
ése no es el proceso tradicionalmente descrito por el término. 


El presente tipo de discriminación puede formularse como ley de 
la manera siguiente: 

LEY DE DISCRIMINACIÓN DEL ESTÍMULO EN EL TIPO $. 
Un reflejo fortalecido por inducción a partir del reforzamiento de un 
reflejo que posea un estímulo similar pero no idéntico puede extinguirse 
separadamente si la diferencia de los estímulos es supraliminar para el 
organismo. Esta formulación es incompleta, ya que ignora el efecto 
recíproco de la extinción sobre el reflejo directamente condicionado y 
la necesidad de condicionamiento y extinción repetidas y alternativas 
para obtener una diferencia de fuerza considerable. Pero como el gra- 
do en que la diferencia se ejecuta es arbitrario y, aparentemente, nunca 
puede ser completo, esta formulación basta. Esta ley se desprende de 
la ley de la inducción, y como su presente formulación implica, no re- 
presenta un nuevo tipo de proceso dinámico. Los cambios que tienen 
lugar en la discriminación son el condicionamiento y la extinción. Sin 
embargo, el proceso es interesante por sí solo y reviste una considerable 
importancia en la conducta del organismo puesto que la mayor parte 
de la conducta condicionada es discriminativa. 

Antes de abordar los dos casos fundamentales de la discriminación 
de estímulos, trataré de clarificar la noción de proximidad de los es- 
tímulos enumerando algunos de los continuos a lo largo de los cuales 
puede mantenerse la inducción. Algunas de las propiedades con res- 
pecto a las cuales los estímulos difieren o se asemejan entre sí son las 
siguientes : 

Topografía general. El caso extremo de diferencia topográfica se 
produce cuando los estímulos caen dentro de departamentos sensoriales 
diferentes, como la visión y la audición. Si la inducción tiene lugar a 
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través de los límites departamentales constituye un problema experi- 
mental simple, pero del que no poseemos una respuesta clara en el 
momento presente. Pavlov habla de inducción de este tipo sólo en los 
reflejos de huella larga (ver capítulo 7). Es probable que generalmente 
quede algún efecto. Los estímulos de diferentes clases tienen en común 
al menos la propiedad de constituir cambios repentinos en el ambiente 
estimulante y ello puede ser suficiente para producir la inducción. Aun- 
que el efecto es al parecer ligero, posiblemente podría revelarse ponien- 
do juntos varios casos. De esta forma, si la misma respuesta condicionada 
estuviera basada en una serie de estímulos de todos los departamentos 
menos uno, podría observarse un efecto si se comprobara finalmente la 
existencia de un estímulo en este departamento exceptuado. Sólo de 
una forma inexacta pueden considerarse los diversos departamentos 
sensoriales como formando un continuo a lo largo del cual se puede 
medir la similitud o la disimilitud. 

Posición. Otro aspecto de la topografía es la posición del estímulo 
dentro de un campo sensorial específico. Se aplica principalmente al 
tacto y a la vista. Más tarde vamos a describir un experimento clásico 
realizado por Pavlov que muestra el efecto de la proximidad de los es- 
tímulos táctiles, Los estímulos que muestran la propiedad de la posición 
también muestran las propiedades de tamaño y forma y pueden diferir 
unos de otros a estos aspectos. 

Cualidad. Dudo en aplicar esta denominación a quizás la propiedad 
más familiar de los estímulos, pero creo que servirá. Ejemplos de ella 
son la longitud de onda en el caso de sonidos y luces, y la estructura 
molecular en el caso de los sabores y olores. Gran parte del estudio 
tradicional de los procesos sensoriales se ha consagrado al hallazgo de 
las menores diferencias con respecto a esa clase de propiedad que bas- 
tan para establecer discriminaciones. 

Intensidad. La otra gran parte del campo tradicional de los procesos 
sensoriales ha versado sobre la discriminación de la intensidad, cuando 
las propiedades precedentes no varían. La intensidad de un estímulo 
se mide en unidades apropiadas a su forma: energía para la vista y el 
oído, concentración para el gusto, etc. 

Pertenencia. Dentro de la misma área sensorial pueden presentarse 
simultáneamente dos o más tonos, puntos luminosos, etc., de la misma 
forma que son posibles combinaciones similares de estímulos entre áreas 
distintas, como por ejemplo, tacto y temperatura, tacto y gusto, luz y 
tono, etc. Las combinaciones serán tratadas aquí como estímulos sim- 
ples, aunque los llamaremos “compuestos” y los representaremos SasSb... 
cuando haya que señalar esta característica especial. Los estímulos 
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compuestos, que son idénticos desde algún punto de vista, difieren si 
cualquier miembro difiere en cualquiera de los continuos ya enumera- 
dos y también pueden diferir simplemente en pertenencia. Así, un es- 
tímulo compuesto por un tono y una luz difiere del compuesto por el 
tono solo o por el tono más un olor. Puede demostrarse fácilmente la 
inducción entre los estímulos compuestos que difieren en pertenencia, 
pero, como en el caso de la topografía general, sólo de forma inexacta 
podemos decir que un grupo de estímulos compuestos constituyen un 
continuo. 

El análisis de los continuos sensoriales es mucho menos simple de 
lo que esta lista parece indicar. No he mencionado muchos problemas 
importantes (como el de si todas las propiedades son manipulables in- 
dependientemente), pero la lista bastará para ilustrar algunos de los 
tipos de inducción que forman parte de las discriminaciones. Actual- 
mente, el problema de la proximidad de los estímulos es más importante 
para la fisiología de los órganos terminales que para la ciencia de la 
conducta. Solamente en un estadio relativamente tardío del estudio de 
la discriminación podemos interesarnos en la medición de la inducción 
en lo que respecta a las diferencias mínimas de las propiedades de los 
estímulos. Al empezar el estudio de la discriminación como proceso po- 
demos usar con provecho pares de estímulos que muestran diferencias 
más bien toscas, porque, en este caso, el efecto inductivo del condicio- 
namiento y la extinción está considerablemente por debajo del efecto 
directo, y la acumulación de una diferencia significativa se realiza más 
fácilmente. 

La medida final de la proximidad inductiva, por supuesto, viene 
suministrada por el organismo. Dos estímulos que conducen a respues- 
tas completamente diferentes en un perro o un científico pueden ser 
indistinguibles para una rata. Lo que trato de indicar aquí es la estruc- 
tura independiente de los estímulos y la medida en que corresponde 
a la conducta discriminativa del organismo. Esta comparación es posi- 
ble en el caso del organismo humano sólo gracias a la invención de téc- 
nicas para revelar diferencias al estimular energías y substancias que 
trascienden la capacidad inmediata del organismo. Un simple ejemplo 
de tales técnicas es el uso de pulsaciones para medir la proximidad de 
dos tonos más allá del punto en que puede detectarse una diferencia 
en una presentación no simultánea. Un ejemplo más elaborado sería el 
uso de un espectroscopio para distinguir las diferencias subliminares 
en las mezclas de colores. 

Una discriminación del estímulo siempre implica la presentación su- 
cesiva de dos estímulos, un procedimiento que es indispensable para 
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comprobar la diferencia de la fuerza de los reflejos. Ciertos procedi- 
mientos elípticos utilizados con organismos humanos han llevado a la 
suposición de que es posible una “comparación” o “juicio” simultáneos, 
como, por ejemplo, cuando el sujeto está mirando un campo dividido 
en dos partes diferencialmente iluminadas. Pero este campo es discri- 
minado de una de dos formas y ambas implican sucesión. En la primera 
de ellas el sujeto mira de una a otra mitad del campo de manera que 
los dos estímulos son presentados alternativamente en la misma parte 
de la superficie receptiva. En la segunda, el sujeto emite una respuesta 
a una pauta (que aquí será tratada únicamente como un caso de compo- 
sición de estímulos), y discrimina entre un “campo homogéneo” y un 
“campo dividido”, que son presentados en sucesión. El uso de los mis- 
mos mecanismos elípticos (que principalmente implican una conducta 
verbal) también ha conducido a la concepción de que la discriminación 
es la identificación de una propiedad “por el nombre” o de alguna for- 
ma similar peculiar. No es esencial para una discriminación que cada 
propiedad del estímulo tenga una forma correspondiente de respuesta. 
El hecho básico es que la respuesta (sea cual sea) se haga a un estímu- 
lo y no a otro. 


La discriminación del estímulo en el tipo S 


Los ejemplos a que hemos aludido en el apartado anterior consis- 
tían en la discriminación del estímulo basada en un reflejo condiciona- 
do tipo S. Puede ser conveniente añadir unas cuantas propiedades del 
proceso, principalmente citadas por Pavlov.? Los datos de Pavlov deben 
aceptarse con ciertas reservas. Pavlov los presentó en apoyo de una 
especial concepción de la “inhibición” y, al reorganizarlos como des- 
cripción del proceso de discriminación considerado aisladamente, a me- 
nudo dejan muchos puntos importantes sin respuesta. Por lo general, 
sólo constituyen casos del proceso descrito, como Hull (48) ha señalado. 
Pavlov no monta un experimento y procede a tratar todos los datos 
resultantes. Como consecuencia de ello cabe un amplio margen para 
la selección inconsciente de los casos favorables. El peligro es especial- 
mente grande porque los experimentos están diseñados para comprobar 
hipótesis en vez de proporcionar una descripción simple. Una vez más, 
Pavlov no está interesado en el curso de los cambios que tienen lugar 


2. A no ser que se indique lo contrario, todas las referencias son de Los re- 
flejos condicionados de Pavlov (64). 
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durante una discriminación, sino solamente en aquel estado más o me- 
nos final en que el miembro extinguido ya no es provocable. Su medida 
usual de la tasa de discriminación es el tiempo requerido para alcanzar 
ese punto, que es insatisfactorio en un estudio dinámico del proceso. 

Pavlov describe un caso de condicionamiento inductivo tipo S y 
su dependencia de la proximidad, de la forma siguiente: “Si se estable- 
ce un tono de 1.000 d. v. como estímulo condicionado, muchos otros 
tonos adquieren propiedades similares, disminuyendo tales propiedades 
proporcionalmente a los intervalos de esos tonos a partir del de 1.000 d. 
v.” Se ponen ejemplos de inducción dentro de otras áreas sensoriales 
consideradas aisladamente, así como el caso señalado más arriba de 
inducción entre límites de áreas distintas en un caso de reflejo de hue- 
lla larga. El efecto inductivo de la extinción se demuestra en un conoci- 
do experimento, cuyo resultado se ha confirmado en sujetos humanos 
por Bass y Hull (26). En el experimento de Pavlov se dispusieron cinco 
pequeños aparatos para producir estimulación táctil a lo largo de la 
pata trasera de un perro, siendo colocado el primero sobre la garra y 
los otros a distancias crecientes de 3, 9, 15 y 22 cm. respectivamente. 
Estos cincos estímulos constituían un grupo inductivo bastante homo- 
géneo; cuando se condicionaba uno de ellos, los demás adquirían un 
rango similar casi en la misma medida. Se estableció una discriminación 
con condicionamientos y extinciones alternas de tal forma que todos los 
estímulos permanecieron condicionados con la excepción del estímulo 
de la garra. Cuando las fuerzas de las cuatro respuestas reforzadas se 
hubieron igualizado, cada una se comprobó después de tres presentacio- 
nes no reforzadas del estímulo extinguido. El resultado fue que la falta 
de reforzamiento del estímulo de la garra redujo la fuerza del punto 
adyacente hasta prácticamente cero y la del segundo punto a la mitad 
de su valor anterior, mientras que los otros dos puntos no se vieron 
afectados o incrementaron su fuerza (ver más abajo). Pavlov describe 
este experimento como demostración de la irradiación de la inhibición. 
Aunque no utilizo el concepto de inhibición en el presente sistema, hay 
que notar que la “irradiación” de Pavlov (de la inhibición o de la ex- 
citación) se parece mucho a lo que llamo aquí inducción. En el caso 
de la excitación a menudo usa del término “generalización”. 

Pavlov utiliza el término “inducción” en un sentido completamente 
diferente. Recurre a la autoridad de Sherrington, pero éste emplea el 
término, como ya he dicho, para dos procesos opuestos ninguno de los 
cuales corresponde al presente fenómeno. Los hechos citados por Pavlov 
no pueden dejar de considerarse. Se describen en su capítulo sobre “In- 
ducción positiva y negativa” y parecen mostrar un efecto directamente 
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opuesto a la inducción. Para evitar confusiones llamaré a este efec- 
to opuesto “contraste”. Los experimentos se refieren a pares de estímulos 
que difieren en diversos continuos (tacto, sonido y luz) que se han usa- 
do para desarrollar discriminaciones. Las observaciones pueden des- 
cribirse independientemente del concepto de inhibición de la forma 
siguiente. En el contraste positivo la presentación del estímulo no refor- 
zado produce un aumento momentáneo de la fuerza del miembro re- 
forzado, aunque hay que esperar un descenso por la ley de la inducción. 
En el contraste negativo el reforzamiento del miembro reforzado demora 
o impide el condicionamiento del no reforzado. Esto es también todo 
lo contrario que cabría esperar de la inducción. Hasta que las condi- 
ciones que determinan si la inducción o el contraste van a ocurrir a 
un momento dado hayan sido identificadas, las observaciones del con- 
traste constituyen simplemente excepciones a la ley de la inducción. 
Poco se sabe actualmente excepto que el contraste es por lo general 
un fenómeno temporal que aparece sólo en un estadio de la discrimi- 
nación y aparentemente no es suficiente para eliminarla a pesar de su 
oposición a la inducción. La inducción es, al parecer, siempre necesaria 
para alcanzar el estadio de la discriminación en que aparece el contras- 
te. En el experimento descrito en el párrafo anterior, el efecto sobre 
el reflejo en el punto de estimulación más lejano fue un ligero aumento 
de fuerza. Esto sugiere que el contraste ocurre a un cierto grado de 
proximidad no demasiado inmediato, pero Pavlov habla de otros casos 
en que el punto más cercano presenta contraste y el más lejano induc- 
ción, y cabe la posibilidad de que no exista relación alguna. 

Es dudoso si el contraste es un proceso genuino comparable a la 
inducción. En muchos de los casos citados por Pavlov saltan a la vista 
explicaciones alternativas, aunque es difícil establecer su validez sobre 
los datos disponibles al menos en las publicaciones no rusas. Por ejem- 
plo, un procedimiento hubiera permitido el desarrollo de un reflejo 
condicionado en que el estímulo fuera el cambio de 1 a A, distinto de 1 
o A separadamente (ver pág. 289), y este reflejo siendo siempre refor- 
zado y no sufriendo extinción inductiva hubiera dado el elevado valor 
observado. Sería fútil abordar cada caso de esta forma, porque el tema 
precisa de una investigación más detallada. Con ello damos por conclui- 
do nuestro examen del problema del contraste. 

Dados los dos procesos de condicionamiento y extinción inductivos 
y su relación con las propiedades de pares de estímulos, no es difícil 
mostrar que la tasa de desarrollo de una discriminación obedece a las 
mismas leyes. Pavlov aporta muchos datos que demuestran este hecho, 
aunque el curso del proceso y su relación con la proximidad no son tra- 
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tados de forma cuantitativa. En particular no se ha mostrado si el pro- 
ceso constituye simplemente la acumulación de diferencias entre cambios 
de fuerza directos e inductivos o implica una separación de los estímu- 
los en el continuo inductivo. En otras palabras, en la obra de Pavlov no 
se muestra si el organismo llega a hacer una distinción entre estímulos 
que ya todavía no eran recibidos en el efecto de inducción o a ensan- 
char esta distinción donde originalmente ya existía hasta cierto punto. 
Esta cuestión es importante y requiere un tratamiento cuantitativo del 
curso del cambio. A ella consagraré un considerable espacio en relación 
con la discriminación de una operante. 


...r 


Abolición de la discriminación 


Cuando la respuesta a un estímulo discriminado se ha extinguido, 
puede restaurarse a su fuerza original mediante el simple recondicio- 
namiento. En un experimento típico citado por Pavlov, la respuesta al 
sonido de un diapasón más la estimulación táctil de la piel se había 
extinguido, mientras que la respuesta al sonido solo había quedado 
condicionada. El estímulo combinado se reforzó luego a intervalos de 
aproximadamente 15 minutos. El estímulo reforzante seguía al estímulo 
condicionado tras un intervalo de un minuto, durante el cual se podía 
medir la respuesta condicionada. El resultado viene expuesto en una 
figura posterior (59). La fuerza del reflejo empieza en cero, pero du- 
rante el curso de siete reforzamientos aumenta hasta el valor esencial 
mente máximo indicado por 14 gotas de saliva. Entonces puede decirse 
que la discriminación ha quedado eliminada. 


La inevitabilidad de una discriminación en este tipo 


El condicionamiento tipo S siempre implica cierta cantidad de in- 
ducción y eventualmente cierta cantidad de discriminación. El estímulo 
a condicionar (S”) puede presentarse contra un trasfondo de estimula- 
ción que surge de la “situación” (SS). En el experimento pavloviano 
supongamos que $” sea un tono y S“ la estimulación que surge de la 
situación experimental. A causa de la inducción, la presentación de un 
estímulo reforzante en presencia de S* S” ocasiona el condicionamiento 
de al menos tres reflejos, a saber (SS . R3), (Sé S*, RI), y (S* . R). El po- 
der de provocar la respuesta se adquiere no sólo por la combinación pre- 
cisa de los estímulos presentes en el momento, sino también por las par- 
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tes componentes. Por consiguiente, el perro puede salivar cuando se 
coloca de nuevo en la situación experimental o cuando se hace sonar 
un tono en un ambiente completamente diferente. Este triple condi- 
cionamiento no puede evitarse totalmente. Teóricamente S9 y S” podrían 
hacerse coincidir, cuando un estímulo dado estuviera siempre presente 
en una situación dada y el complejo estimulante total fuera reforzado. 
Pero entonces casi no sería posible ningún tipo de experimentación. Una 
solución más práctica es hacer que $“ sea insignificante con respecto 
a S”, Esto puede hacerse al menos de dos modos: reduciendo el valor 
de S“ (diseñando la situación experimental de modo de que se consiga 
un mínimo de estimulación general) o intensificando S' (utilizando un 
estímulo fuerte o presentándolo de repente poco antes del reforzamien- 
to). Estas estratagemas son corrientes en la experimentación sobre con- 
dicionamiento de este tipo, pero a pesar de ellos se produce una cierta 
inducción a la situación experimental. Como las respuestas a la situación 
perturban el experimento, generalmente se eliminan por extinción. En 
Otras palabras, se establece una discriminación en que las respuestas 
a Se S* son reforzadas y las respuestas a SS sólo, extinguidas. 

La regla general de que cierta cantidad de discriminación está pre- 
sente en todo caso real de reflejo condicionado de este tipo se observa 
asimismo fuera del laboratorio. Los estímulos reforzantes casi se corre- 
lacionan invariablemente con estímulos que no componen toda la es- 
timulación que afecta al organismo en el momento del reforzamiento. 
Por consiguiente, el reforzamiento tiene un efecto más amplio de lo 
que la correlación real implica y con el tiempo se produce la extinción 
del efecto suplementario. 


Discriminación del estímulo en el tipo R: 
La correlación de un estímulo discriminativo 
con el reforzamiento de una operante 


La conexión entre una operante y un estímulo reforzante puede 
establecerse independientemente de toda estimulación específica que 
actúe antes de la respuesta. En una ocasión dada de reforzamiento, por 
supuesto, las fuerzas estimulantes estarán en juego, pero con atención 
constante es posible reforzar una respuesta (por ejemplo, un movimien- 
to dado de la pierna) bajo muchos conjuntos diferentes de fuerzas esti- 
mulantes e independientemente de todo conjunto dado. Sin embargo, 
en la naturaleza la contingencia de un reforzamiento sobre una res- 
puesta no es mágica: la operante debe operar sobre la naturaleza para 
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producir un reforzamiento. Aunque la respuesta puede producirse li- 
bremente en una serie muy grande de situaciones estimulantes, será 
efectiva en cuanto a la producción de un reforzamiento sólo en una 
pequeña porción de cilas. La situación favorable generalmente queda 
señalada de alguna forma, y el organismo hace una discriminación de 
un tipo que ahora pasaremos a abordar. El organismo responde siempre 
que está presente un estímulo que ha estado presente con ocasión de 
un reforzamiento previo y no responde en caso contrario. El estímulo 
anterior no povoca la respuesta, sino que simplemente determina la 
ocasión en que la respuesta será reforzada. 

En un mundo en que el organismo es un ser aislado y errante, las 
necesidades mecánicas del reforzamiento requieren, además de la corre- 
lación entre la respuesta y el reforzamiento, esta correlación adicional 
con la estimulación anterior. Por lo tanto, debemos considerar tres tér- 
minos: un estímulo discriminativo anterior (SP), la respuesta (RO) y el 
estímulo reforzante (S'). Su relación puede formularse de la manera 
siguiente: sólo en la presencia de SP, RO ya seguido de S', Un ejemplo 
apropiado es la conducta elemental de tomar contacto con partes especí- 
ficas del ambiente estimulante. Un cierto movimieno de mi brazo (R0) 
es reforzado por la estimulación táctil de un lápiz situado encima de 
la mesa (S'). El movimiento no siempre es reforzado porque el lápiz 
no siempre se encuentra allí. En virtud de la estimulación visual del 
lápiz (SP), hago el movimiento requerido sólo cuando será reforzado. 
El papel que juega el estímulo visual queda claro si consideramos el 
mismo caso en una habitación oscura. En una ocasión extiendo el brazo 
y toco el lápiz, en otra ocasión extiendo el brazo y no lo toco. No hay 
manera de que pueda llegar a responder sólo en las ocasiones favora- 
bles. Sólo puedo “tantear”, es decir, extender el brazo en ausencia de 
un estímulo discriminativo. Ni en la luz ni en la oscuridad el lápiz 
provoca mi respuesta (de la misma forma que una descarga eléctri- 
ca provoca una flexión), pero en la luz determina la ocasión en que 
una respuesta será reforzada y (mediante el desarrollo de una discrimi- 
nación) en que ocurrirá. Aunque una operante condicionada es el resul- 
tado de la correlación de la respuesta con un reforzamiento particular, 
una relación entre éste y un estímulo discriminativo que actúe antes 
de la respuesta es casi la regla universal. 

Al analizar una cadena de reflejos en lugar de un solo miembro, 
debemos considerar un tipo diferente de relación discriminativa. Un 
estímulo discriminativo puede correlacionarse con el reforzamiento fi- 
nal de una cadena, pero no con el miembro que inmeditamente pre- 
cede. Una campanilla anunciando la comida constituye un estímulo 
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discriminativo remoto que está correlacionado con el reforzamiento del 
miembro final de lo que puede ser una larga cadena de reflejos. La 
discriminación remota es mucho más común que la inmediata, por cuan- 
to esta última se limita principalmente a la conducta de la manipulación. 
La posibilidad de una discriminación remota plantea el importante pro- 
blema de la relación de la manipulación con el reforzamiento final, esto 
es, del medio con el fin. La formulación es esencialmente la misma en 
los dos casos. 

La cadena de reflejos estudiada en los capítulos anteriores, como 
dijimos en el capítulo 2, implica una discriminación. La rata llega a 
emitir ciertas respuestas de progresión y modificación postural con 
respecto al comedero, porque en presencia de los estímulos (principal- 
mente táctiles) que surgen del comedero y de sus alrededores estas 
respuestas llegan a producir el contacto con la comida. Más tarde res- 
ponde sólo después de que haya sonado el almacén, porque la corre- 
lación existente entre la respuesta y la comida se ve limitada de esta 
forma. Habría sido posible elegir un ejemplo que evitara la discrimi- 
nación, verbigracia usando una respuesta que no operara directamente 
sobre el ambiente, pero, por razones que ya he considerado, el caso no 
hubiera sido típico. El uso de una muestra de conducta que implique 
discriminación es razonablemente seguro porque la última parte de la 
cadena permanece esencialmente constante durante los cambios de 
fuerza del miembro inicial que estamos estudiando. Si ahora hacemos 
que el miembro inicial sea discriminativo y procedemos al estudio del 
proceso directamente, podemos pisarnos la cola y volver a justificar 
nuestros supuestos sobre la muestra original. 

La discriminación que vamos a describir es del tipo remoto. Un 
estímulo que actúe antes de la respuesta a la palanca está correlacio- 
nado con el reforzamiento final de la cadena. Los estímulos que he 
usado son una luz de 3 c. p., un chasquido y un zumbido. Son relati- 
vamente toscos y no plantean el problema del umbral. Una operante 
que ocurra en presencia de un estímulo correlacionado con reforza- 
miento se escribirá sSP.R; en ausencia de un estímulo de este tipo, 
se escribirá sSA.R. La propiedad discriminativa, en este caso, es sola- 
mente una cuestión de pertenencia. 


La inducción durante el reforzamiento continuo 


Antes de abordar el proceso de discriminación, trataré de estimar 
el papel desempeñado por una luz en el control de la reserva creada 
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por el reforzamiento que tiene lugar en su presencia. Supongamos que 
una respuesta ha sido bien condicionada en presencia de la luz (además 
de la estimulación general inevitable). Si ahora llevamos a cabo la ex- 
tinción en ausencia de la luz, disponemos de una medida de la induc- 
ción de una situación a otra, por cuanto podemos comparar esta curva 
con la de la extinción en presencia de la luz para mostrar el grado en 
que el estímulo influencia la respuesta. Como ambas curvas no pueden 
obtenerse con el mismo organismo, un experimento de esta índole 
debe realizarse con un grupo bastante extenso. Todavía no se ha llevado 
a cabo, pero se ha obtenido una evaluación de la diferencia con un 
método ligeramente diferente basado en el mismo principio. Hacia 
el fin de la curva de extinción obtenida en la oscuridad tras el condi- 
cionamiento en la luz, dicha luz es introducida y mantenida. Las res- 
puestas que se hallan bajo el control de esta parte especial de la 
estimulación original aparecen en una curva de extinción adicional. 

En un experimento se condicionaron cuatro ratas de unos 100 días 
de edad, de la forma usual, si exceptuamos el hecho de que la luz de 
la caja experimental estaba encendida. Se reforzaron cincuenta res- 
puestas a la palanca, y al día siguiente se iniciaron curvas de extinción 
en ausencia de la luz. Transcurridos cuarenta y cinco minutos se en- 
cendió la luz, y se observó el curso posterior de la extinción durante 
veinte minutos. La “latencia” media de la respuesta a la luz fue de 
20,5 segundos, es decir, la rata respondió por primera vez veinte se- 
gundos después de encenderse la luz. A la tasa predominante en la 
oscuridad la latencia debida a la casualidad hubiera sido de unos 
treinta y seis segundos. Este efecto positivo de la luz es corroborado 
por el cambio de tasa subsiguiente. La curva media correspondiente a 
las cuatro ratas viene dada en la figura 53 A. Empieza de la forma 
usual y muestra una ligera desviación por debajo de la envolvente. En 
la flecha se encendió la luz con el fin de restaurar el complejo estimu- 
lante exacto que estaba presente en el momento del condicionamiento. 
Se produjo un significativo incremento de tasa que fue seguido de 
un ligero debilitamiento compensatorio. El final de la curva se halla 
sólo ligeramente por encima del punto que se hubiese alcanzado sin 
la estimulación adicional. 

Es posible que no se experimentara un efecto mayor en este expe- 
rimento debido a que la presentación del estímulo suplementario se 
retrasó demasiado. En un segundo experimento, asimismo realizado con 
cuatro ratas, la presentación ocurrió antes en el curso de la extinción. 
En todo lo demás, el procedimiento fue el mismo. La curva media 
viene dada en la figura 53 B. El grupo dio curvas de extinción consi- 


196 


derablemente menores, pero el resultado está suficientemente claro. 
La “latencia” media de la primera respuesta a la luz fue en este caso 
de 15 segundos en lugar de un valor aleatorio de sesenta. La tasa fue 
la misma que en el primer experimento y relativamente varió en la 
misma medida. Una vez más es evidente que el aumento de tasa que 
sigue momentáneamente a la introducción de la luz va acompañado por 
una disminución compensatoria. El resto de la curva no está por ne- 


RESPUESTAS 


TIEMPO EN MINUTOS 


Ficura 53 
EFECTOS INDUCTIVOS EN LA EXTINCIÓN 


La extinción empieza en ausencia de un estímulo que ha estado siempre presente 
durante el reforzamiento. Cuando este estímulo es introducido (en las flechas), la 
tasa se eleva temporalmente 


cesidad significativamente por encima de ia extrapolación de la curva 
en ausencia de la luz. 

Ninguno de los dos resultados es lo bastante claro para indicar de 
forma precisa si el efecto de la luz es producir una segunda curva 
(como la observada en la extinción separada de los miembros de la 
cadena, p. 120) o simplemente proporcionar un aumento temporal de 
tasa que se compensa más tarde. De los dos experimentos se despren- 
de que es probable que la compensación ocurra, pero que no sea 
completa. En la figura 53 A desgraciadamente el experimento no se 
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prosiguió lo suficiente para determinar la posición final de la curva 
con respecto a una extrapolación de la primera parte. Es difícil decir 
si la curva B continúa significativamente por encima de la extrapola- 
ción a la vista de la sección muy corta de la curva original obtenida. 
En gran parte depende de la importancia que se conceda al último 
punto antes de la introducción de la luz (el punto de la flecha). Si se 
toma demasiado bajo (cf. el tercer punto a partir del final de la curva), 
puede trazarse una curva Satisfactoria con respecto a la que el incre- 
mento de tasa debido a la luz sea una cuestión temporal con plena 
compensación. Evidentemente, el experimento debe repetirse con mues- 
tras mayores. Sin embargo, nos permite decir con cierta seguridad que 
la introducción del miembro ausente produce un marcado aumento de 
tasa, seguido por cierta compensación. 

En cuanto a la fiabilidad de este resultado, debemos señalar que 
las observaciones hechas en el capítulo 3 sobre el promedio de las 
curvas de extinción puede aplicarse aquí. El efecto mostrado en el 
promedio es evidente en cada registro individual con una sola excep- 
ción. Puede obtenerse alguna indicación de la fiabilidad a partir del 
aceptable grado de suavidad de las curvas trazadas a través de los 
puntos y a partir del hecho de que representan promedios de mues- 
tras reducidas y no implican selección de ningún tipo. Dos experi- 
mentos de control en los que la extinción empezó bajo las condiciones 
exactas del reforzamiento precedente y continuó después de que se 
hiciera un cambio diferenciador en la dirección opuesta no dieron 
ningún aumento de tasa. 

Tal vez habría que señalar que este resultado no está en contra- 
dicción con la imposibilidad de confirmar la noción de desinhibición. 
En los experimentos citados en relación con ese asunto (p. 112), la luz 
no produjo efecto alguno sobre las curvas de extinción excepto si se 
presentó cuando las curvas estaban por debajo de sus envolventes. En 
el presente caso la luz ha adquirido un poder especial al haber estado 
presente en el momento del condicionamiento. Lo que resta aclarar 
es en qué difiere el efecto en los dos casos. 


Discriminación después de recondicionamiento periódico 


Una discriminación implica necesariamente condicionamientos y ex- 
tinciones alternativos. Si estamos interesados simplemente en alcanzar 
un punto final de discriminación más o menos completa, podemos 
transferir nuestra atención de un proceso a otro a medida que la con- 
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dición del organismo lo exija. Pero si estamos interesados en la ciné- 
tica del proceso, las tasas de condicionamiento y extinción deben ser 
constantes o al menos rígidamente controladas. Como el condiciona- 
miento se produce más rápidamente que la extinción, presumiblemente 
necesitamos una gran cantidad de esta última. El programa para esta- 
blecer una discriminación, por consiguiente, será tal que sSP.R sea 
ocasionalmente reforzado y que permita que sS%.R no sea reforzado 
en las restantes ocasiones. Se trata de una forma de reforzamiento pe- 
riódico, si exceptuamos que la respuesta reforzada siempre se hace 
en presencia de SP, y el procedimiento es idéntico al del recondiciona- 
miento periódico si exceptuamos que SP es presentado cuando el alma- 
cén es conectado periódicamente. En el acto de conectar simultánea- 
mente los interruptores de SP y el almacén queda ejemplificada la 
condición fundamental de una discriminación de este tipo. 

El resultado que cabe esperar es el mantenimiento de (sS»,R) y 
el agotamiento de (sS%.R). Si se registran todas las respuestas, el 
registro experimental debe dar el curso de este último proceso cuando 
se han sustraído las provocaciones periódicamente reforzadas de SP, R. 
No disponemos de ninguna media de la fuerza de sS”.K, puesto que 
su tasa viene determinada aquí por la tasa de presentación de SP, Sin 
embargo, más tarde mostraré que el estado de sS”.,R puede exami- 
narse de otras formas. El efecto del condicionamiento inductivo de 
SD a S% debe aparecer claramente como una modificación de la curva 
de extinción correspondiente a sS2.R. 

El capítulo anterior sobre el recondicionamiento periódico propor- 
ciona un control muy necesario, control que, creo yo, no se aplica en 
experimentos con otros métodos. Tenemos que mostrar que los cam- 
bios en la tasa de extinción de s5%.R se deben a la inducción a partir 
del reforzamiento de sSP.R y que no son el resultado de condiciona- 
mientos y extinciones alternativas o del desarrollo de una discriminación 
temporal. La última posibilidad puede volverse en contra del método 
puesto que sigue un claro programa de condicionamiento y extinción. 
Los controles suministrados por el capítulo anterior son adecuados. La 
discriminación se observa como un cambio de la tasa constante que se 
obtiene bajo recondicionamiento periódico, y para los pares de estí- 
mulos (S% y S3) aquí usados, el proceso requiere un período de tiempo 
durante el cual esta tasa pueda considerarse como esencialmente cons- 
tante, con tal que la pendiente constante se haya establecido plena- 
mente antes del inicio de la discriminación. Se observa que la discri- 
minación temporal corre a cargo de cambios compensatorios adecuados. 
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En todo caso, no constituye un problema grave dado que usaré una 
tasa de provocación bastante moderada, inducida por un período de 
recondicionamiento de cinco minutos, en que no se hallan presentes en 
grado considerable desviaciones de segundo o de tercer orden. El 
cambio observado durante el establecimiento de una discriminación 
afortunadamente es de un orden de magnitud tal que su confusión con 
cualquiera de los restantes tipos de desviación es improbable. 

Un caso en el que las fuerzas de los reflejos se separan lentamente 
es aquél en que sS5%.R ha sido reforzado periódicamente y tiene una 
gran reserva mientras que sSP.R no ha sido reforzado previamente, 
aunque ha adquirido una elevada fuerza mediante la inducción. Acto 
seguido vamos a considerar un experimento de este tipo. 


Cuatro ratas de la misma familia —P11, P12, P13 y Pl4— se condi- 
cionaron para responder a la palanca a la edad de 100 días. Tres días 
más tarde se transfirieron directamente a un recondicionamiento perió- 
dico, sin ninguna extinción intermedia, de acuerdo con un intervalo de 
cinco minutos. La figura 35 se obtuvo a partir de este grupo. Se eligió 
este intervalo porque había dado la desviación normal más baja en el 
experimento de la figura 83. Asimismo da una tasa lo suficientemente 
moderada como para permitir cambios significativos en ambas direc- 
ciones y prácticamente libre de desviaciones de segundo y de tercer 
orden. Los experimentos se llevaron a cabo durante períodos de una 
hora en días alternos. Asimismo se observaron los otros detalles de pro- 
cedimiento ya citados en el capítulo anterior. Se obtuvieron tres regis- 
tros diarios de recondicionamiento periódico, durante los cuales se 
estabilizaron pendientes constantes características. Entonces se cambió 
de procedimiento hasta incluir la luz o el sonido del almacén al funcio- 
nar (este último con P11 y P12, la luz con P13 y P14). En el caso de la 
luz, el estímulo suplementario, presentado antes de la respuesta refor- 
zada, estaba aún presente cuando se emitió la respuesta, pero ello no 
fue así en el caso del sonido del almacén (ya que no era continuo). Entre 
los resultados de los dos casos no apareció ninguna diferencia signifi- 
cativa, por lo que en la discusión siguiente vamos a considerar los re- 
gistros conjuntamente. Llamaré simplemente al estímulo discriminativo, 
la luz o SD, 

El procedimiento discriminativo de una sesión diaria era el siguien- 
te: Cuando se soltaba al animal la luz y el almacén se habían conectado 
ya, y la primera respuesta a la palanca, en presencia de la luz, se refor- 
zaba con un gránulo de comida. Entonces se desconectaban la luz y el 
almacén, con lo cual las respuestas hechas durante los cinco minutos 
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siguientes no eran reforzadas. Al final de este espacio de tiempo se 
conectaban de nuevo la luz y el almacén, procurando que ello no se pro- 
dujera en el mismo instante que tenía lugar una respuesta. Cuando se 
había hecho (y reforzado) una respuesta, la luz y el almacén se des- 
conectaban otra vez, repitiendo dicha operación hasta un total de doce 
reforzamientos. Al final del último intervalo no se reforzaba respuesta 
alguna, y se sacaba al animal de la caja. El sonido se empleó de la mis- 
ma forma, con la excepción ya notada. El procedimiento se repitió du- 
rante diez días. 


El retraso en apretar la palanca (la “latencia” de la respuesta discri- 
minativa) no se añadió al intervalo. Esto no sólo simplifica el trata- 
miento de los datos sino que constituye una parte necesaria del proce- 
dimiento en una discriminación, ya que el primer cambio significativo 
en la conducta de la rata es el acortamiento del retraso. La respuesta 
a SP aumenta inmediatamente su fuerza gracias al valor resultante dado 
por la pendiente constante hasta un valor aproximadamente máximo 
indicado por la latencia. Aquí no me interesa este cambio de fuerza del 
reflejo reforzado, pero no debe permitirse que el cambio de la duración 
del retraso afecte al intervalo. De lo contrario, el cambio correlacionado 
en la pendiente total se introduciría como un artefacto. 


El resultado del experimento viene dado en la figura 54, en que 
hemos juntado los registros de cada rata correspondientes a dos días 
antes del cambio de técnica y a diez días después del mismo con objeto 
de formar gráficas continuas (las líneas más gruesas de la figura). Los 
ocho primeros registros después del inicio de la discriminación vienen 
reproducidos en la figura 55, a partir de una serie típica. La figura 
corresponde a una rata que muestra una tasa básica relativamente alta 
bajo recondicionamiento periódico, en el cual se usó el sonido para 
establecer la discriminación. 


Los dos primeros días de la figura 54 establecen las pendientes ad- 
quiridas bajo recondicionamiento periódico inmediatamente antes de 
la discriminación. Tan pronto como el procedimiento se convierte en 
discriminación mediante la introducción de un estímulo diferenciador, 
la pendiente de cada curva empieza a declinar. La fuerza del reflejo 
en presencia de $? sigue siendo alta, pero el reflejo en presencia de la 
palanca sola gradualmente disminuye en fuerza, alcanzando al final un 
valor muy bajo. 

El cambio no es lo bastante rápido como para revelarse muy clara- 
mente al cabo de una hora. No obstante, los registros del primer día se 
apartan sin lugar a dudas de la línea recta usual y adquieren una cur- 
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vatura característica, convexa hacia arriba, que asimismo aparece en los 
días siguientes. El curso puede verse distorsionado por desviaciones de 
cuarto orden. En particular hay una tendencia hacia el overshooting, 
a saber, un período de respuesta activa seguido de una disminución 
compensatoria de la tasa de provocación. En la figura 55 hemos indi- 
cado seis ejemplos, en que el curso probable de cada curva ha sido 
trazado con líneas discontinuas. Las otras desviaciones son menos ex- 


RESPUESTAS 


PERÍODOS EXPERIMENTALES DIAR!OS 
Ficura 54? 


EL DESARROLLO DE UNA DISCRIMINACIÓN 


En la línea discontinua vertical se introdujo un estímulo discriminativo poco antes 

de cada reforzamiento periódico. Las tasas predominantes durante el reforzamiento 

periódico simple (los dos primeros días de la figura) declinan a lo largo de las 
curvas teóricas (líneas más finas) estudiadas en el texto 


tensas, y en general el curso de cada registro puede inferirse fácilmente. 
Con una excepción ocasional la pendiente diaria declina progresiva- 
mente durante los diez días del experimento. 

No tenemos el propósito de describir el cambio que tiene lugar a 
lo largo de una hora. Es comparativamente poco importante, y los 
registros están sometidos a demasiadas variaciones incidentales como 
para hacer que una descripción cuantitativa sea convincente o útil 
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para nuestros presentes propósitos. No obstante, el cambio mayor que 
se produce durante el curso entero de la discriminación es significativo. 
Con una sola excepción, las curvas dadas por los puntos finales de 
los registros diarios quedan fielmente descritas por la ecuación 
N =Klogt +C + ct, en que N es igual al número de respuestas, £ es 
igual al tiempo, y K y C son constantes, y en que c es igual a 12 y 
es introducido para tener en cuenta las respuestas a la palanca hechas 
en presencia de la luz. La excepción corresponde a P12, que requiere 
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TIEMPO 


FiGURA 55 9 


SERIE DE REGISTROS DIARIOS DE UNA RATA DE LA FIGURA 54 


En la figura vienen representados ocho registros que empiezan en la línea vertical 
de la figura 54 


un valor de c, aproximadamente igual a 25, Esta rata emitió unas trece 
respuestas suplementarias por hora, uniformemente, a lo largo del pro- 
ceso. En la figura 54 las curvas teóricas han sido trazadas a través de 
los datos de esta ecuación en que se ha permitido que c variara a 
partir de 12 con objeto de obtener el ajuste óptimo. Los valores de las 
constantes vienen dados en la tabla 6. La curva media correspon- 
diente a las cuatro ratas queda bien ajustada cuando c = 12. Sustra- 
yendo las respuestas hechas en presencia de la luz y promediando las 
cuatro series se obtienen los datos de la curva superior de la figura 56 
(página 206). La curva responde a la ecuación N = K log t + C, en que 
K = 612 y C = 208. Ya veremos que el punto experimental es algo 
elevado al final de la primera hora, pero que, en general, se obtiene 
un buen ajuste. 
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La validez de esta descripción es restringida. Se ha advertido que 
el ajuste solamente se produce con respecto a los puntos finales de 
los registros diarios. El cuerpo de cada curva no puede incluirse en 
una ecuación tan sencilla. El tiempo representado por t no es continuo, 
sino una sucesión de períodos discretos, y la curva interrumpida al 
cabo de una hora no sigue inalterada al reanudar el experimento 47 
horas más tarde. En otras palabras, hay cierta recuperación espon- 
tánea. Al carecer de un tratamiento cuantitativo del cambio diario, 
tenemos que recurrir a un tratamiento como el presente, en que los 
registros se juntan para formar gráficas continuas. Al tomar la altura de 
la curva diaria a un punto arbitrario, como una medida conveniente 


TABLA 6 


P11 P12 P13 Pl4 


¡AA 825 295 765 375 
Guipsns 265 130 370 105 
Ocio 15 25 15 10 


de la conducta para el día, se introduce una fuente de error probable, 
ya que la curva, al cabo de una hora, puede hallarse en curso de una 
desviación. Las desviaciones más graves en el presente caso son las del 
overshooting. Por ello, los puntos finales de los registros de los pri- 
meros días (en que el overshooting es más prominente) se hallan por 
encima de las curvas teóricas. 

Otra ligera irregularidad se presenta tanto en este caso como en 
el recondicionamiento periódico porque, como mostramos en el ca- 
pítulo 10, la tasa diaria depende del hambre de la rata. El hambre se 
mantiene lo más constante posible, y los resultados obtenidos con el 
recondicionamiento periódico (figura 29) constituyen un control ade- 
cuado contra toda variación de día en día, pero incluso con el sistema 
de alimentación más cuidadoso aparecen, ciertamente, trastornos tem- 
porales ocasionales en la condición de un animal. El sexto registro 
correspondiente a P11, en la figura 55, evidentemente es demasiado 
alto, y es razonable atribuir la anormalidad a una condición de incre- 
mento de hambre. No está claro si las respuestas suplementarias del 
registro se toman de registros posteriores de la serie o si la curva total 
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se desplaza en conjunto a partir del día anómalo en adelante. La 
curva correspondiente a P11, en la figura 54, se ha ajustado como si el 
aumento del sexto día fuera compensado durante los dos días inmedia- 
tamente siguientes. Puesto que un aumento de tasa en una curva de 
extinción debido al incremento del hambre se ve compensado en grado 
considerable (ver capítulo 10), el tratamiento presente es correcto si 
la interpretación de la discriminación, como extinción, es correcta, 

La ecuación es totalmente empírica, y no debemos conceder ningu- 
na importancia a sus constantes. Sería posible derivar una ecuación 
racional correspondiente a dicha curva y la curva de extinción, de la 
noción de la reserva del reflejo, pero no veo la razón para apresurar 
demasiado las cosas hacia esta conclusión natural, ya que los factores 
que entran en la curva no se han identificado en absoluto. 


TABLA 7 


Si la presente interpretación de la discriminación es correcta, las 
curvas deben asemejarse a las obtenidas durante la extinción, quizás con 
cierta modificación debida a la inducción del reforzamiento concurrente 
de un reflejo relacionado. La interpretación puede comprobarse apli- 
cando la misma ecuación empírica a los datos previamente obtenidos 
para la extinción después de recondicionamiento periódico. En la fi- 
gura 88 se han trazado curvas teóricas como en la figura 54. Al ajustar 
las curvas, el primer período se consideró como de 1% días, y los otros 
puntos se tomaron como de 2%, 83% días y así sucesivamente. Este 
procedimiento se basa en el supuesto de que la variable importante 
es el tiempo-en-la-caja-experimental, En este caso, las constantes vienen 
dadas en la tabla 7. La constante c no tiene aquí ninguna importancia 
en comparación con la que posee en la discriminación. 

Los registros del primer día de extinción se elevan considerable- 
mente por encima de las curvas teóricas, aunque el punto final de la 
curva media de la figura 56 no se halla situado más allá de la curva que 
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de la razón de extinción. Esto puede verse comparando los registros 
en el caso de la discriminación. Este overshooting, en el caso de la 
extinción debe explicarse recurriendo a la discriminación temporal que 
tiene su base en la recepción de la comida durante el recondiciona- 
miento periódico. En la extinción no se recibe comida alguna y la tasa 
se eleva debido a la discriminación (ver capítulo 7). Durante la discri- 
minación, sin embargo, se produce una administración periódica de 
comida y la rata no va mucho más allá de lo observado durante el 
recondicionamiento periódico. 


DISCRIMINACIÓN 
C= 208 K=612 


. EXTINCIÓN 
CE 140 K=434 


RESPUESTAS 


4 


HORAS 
FicurRA 56 
COMPARACIÓN DE LA EXTINCIÓN Y LA DISCRIMINACIÓN 
Las curvas corresponden a los promedios de los datos de las figuras 54 y 38 


Los datos medios para la extinción de las cuatro ratas vienen dados 
en la curva inferior de la figura 56 y se ajustan razonablemente bien a 
la ecuación N = K log t + C, en que K = 434 y C = 140. La diferencia 
significativa entre los dos procesos radica en la pendiente de las curvas 
o en el valor de K. Pero antes de que podamos usar éste como medida del 
efecto de la inducción, debemos tomar en consideración los hechos si- 
guientes: El valor de K depende, hasta cierto punto, de la cantidad de 
tiempo en que el recondicionamiento periódico ha sido aplicado. Las 
historias de los dos grupos diferían considerablemente a ese respecto. 
Las ratas usadas en la extinción habían sido condicionadas periódica- 
mente durante un largo período. Esto hace que la diferencia de las 
dos curvas sea tanto más significativa, pero el efecto es presumible- 
mente leve, como puede verse comparando la figura 56 B con la fi- 
gura 39. Una consideración mucho más seria es que el valor de K 
depende de la tasa de respuesta durante el recondicionamiento perió- 
dico antes de la extinción o discriminación, o bien, en otras palabras, 
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individuales de las figuras 38 y 54. Hay una relación entre la pen- 
diente original durante el recondicionamiento periódico y la pendiente 
de la curva subsiguiente. La tasa de respuesta difiere entre los dos 
grupos en la dirección correcta y en una medida suficiente como para 
explicar casi por completo toda la diferencia observada. La razón de 
las tasas medias de los dos días anteriores a la discriminación y la 
extinción es de 347: 257 o 1,85: 1. La razón de los valores de K es 
de 612 : 434 o de 1.4 : 1. 

En vista de la diferencia de las tasas de respuesta precedentes no 
podemos aceptar la diferencia del valor de K como una indicación de 
interferencia inductiva a partir del reforzamiento periódico de sS2.R, 
sino que debemos concluir, por el contrario, que para ese valor de 
SD el proceso de extinción se produce sin ninguna interferencia signi- 
ficativa. Expresado en términos de la reserva del reflejo, el recondi- 
cionamiento periódico de sSP.R no aporta prácticamente nada a la 
reserva de $8%.R. A partir de la ecuación de la discriminación, pode- 
mos extrapolar hasta un punto en que sSP.R sea reforzado periódica- 
mente y sS2.R prácticamente no ocurra nunca. Aquí el reforzamiento 
periódico de sS”.R evidentemente no constribuye en nada al fortale- 
cimiento de s8%.R, y de las curvas que hemos obtenido podemos 
concluir que prácticamente siempre sucede así. Además de revelar la 
naturaleza de la discriminación como extinción, el experimento indica 
un cambio repentino en la inducción entre sSP ,R y sS2,R cuando un 
reforzamiento diferencial ha sido basado anteriormente en SD, 

Durante un proceso de este tipo podemos tomar la razón de (sSP. R) 
y (sSA. R) como una indicación del grado de la discriminación, y éste 
será proporcional a la tasa de ocurrencia de sS4.R. Pero ya mostra- 
remos más tarde que la tasa, asimismo, depende de otras variables, como, 
por ejemplo, el impulso (ver capítulo 10). Rebajando el impulso es 
posible alcanzar un punto en que podamos obtener respuestas en pre- 
sencia de SP a la vez que pocas o ninguna respuesta en presencia 
de S%, aun cuando la discriminación no esté muy avanzada. Tan 
pronto como existe una diferencia entre (sSD,R) y ((sS3.R) es po- 
sible hallar un valor del impulso tal que (sSP.R) sea preliminar y 
(sS2 , R) subliminar. Por consiguiente, es ilegítimo tomar el punto en 
que se hace una respuesta a un estímulo y no al otro como el punto 
final del proceso. La medida de la discriminación usada por Pavlov y 
por muchos otros queda, en este aspecto, abierta a la crítica. Tal como 
se formula en el presente sistema es evidente que la discriminación 
es una cuestión de grado. El uso de un punto final se basa en la 
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noción popular absoluta del desarrollo de la capacidad para distinguir 
entre dos estímulos, y no tiene cabida aquí. 

Aunque la fuerza del reflejo extinguido se acerca a un punto en 
que no se emitirá nunca respuesta alguna en ausencia del estímulo 
discriminativo, ese punto probablemente nunca se alcanza. Aun cuando 
pueda llegarse a él, en la práctica, bajo un impulso dado, puede obte- 
nerse generalmente una respuesta incrementando el impulso. Así, aun- 
que una respuesta verbal como “¡Agua!” depende para su reforza- 
miento de la presencia de otra persona que hace las veces de estímulo 
discriminativo, puede provocarse una respuesta en ausencia de otra 
persona en casos de sed extrema (ver el tratamiento del impulso en el 
capítulo 10). Asimismo, aunque la respuesta de arrojar una pelota se 
refuerza sólo cuando la mano recibe estimulación táctil de la pelota 
(de forma que detenemos el lanzamiento si soltamos la pelota), sin 
embargo en estados extremos de impulso a menudo ejecutamos el movi- 
miento del lanzamiento en ausencia de esta estimulación, una forma. de 
conducta (“irracional”) fácilmente observada en los jugadores de ba- 
loncesto. Ciertos tipos de tics son operantes que ocurren sin estímulos 
discriminativos apropiados. 


sn. 


La abolición de la discriminación 


Como ulterior comprobación del estado de sS3.R, podemos exa- 
minar la tasa en que se recondiciona. El recondicionamiento puede 
efectuarse muy rápidamente por reforzamientos sucesivos, y el resultado 
(como el del recondicionamiento después de la extinción) se parece 
mucho al condicionamiento original. En la figura 57 representamos 
dos registros típicos. En las líneas verticales los almacenes se conectaron 
permanentemente, y se reforzaron todas las respuestas siguientes en 
presencia de lo que había sido S%. Podemos observar cierto ligero re- 
traso en la aceleración hasta la tasa máxima, típico de muchas curvas 
con recondicionamiento. El cambio es demasiado rápido para permi- 
tir un análisis detallado, y es preferible restaurar el reflejo extinguido 
no hasta una fuerza máxima, sino hasta la fuerza intermedia observada 
bajo el condicionamiento periódico original, anterior a la discrimina- 
ción. SP, por tanto, es omitido y sS%.R es recondicionado periódica- 
mente al intervalo elegido. 

En la figura 58 mostramos un resultado típico. El registro A co- 
rresponde al séptimo día de una discriminación durante la cual se 
reforzaron periódicamente las respuestas en presencia de SP, mientras 
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que se extinguieron las respuestas intermedias en presencia de S?. 
En realidad, SP consistió en este caso en la ausencia de la luz y S*% en 
su presencia. El caso representa una inversión de las condiciones ante- 
riores, pero, como mostraremos más tarde, los dos casos son esencial- 
mente idénticos. El registro B corresponde al día siguiente al regis- 
tro A. Todas las respuestas se hacen en presencia de S%, y como estas 
respuestas no han sido reforzadas durante la discriminación, la tasa 
empieza en el bajo valor dado en el registro A. Sin embargo, la res- 
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FiGurA 57 
RECONDICIONAMIENTO DEL REFLEJO EXTINGUIDO DESPUÉS DE UNA DISCRIMINACIÓN 
En la primera parte de cada curva se reforzó periódicamente la respuesta en pre- 
sencia de una luz; en ausencia de la luz la tasa es baja. Después de las líneas 
verticales se reforzaron todas las respuestas en ausencia de la luz. El recondicio- 
namiento es típico y, al igual que después de la extinción (cf. figura 10), se parece 
mucho al condicionamiento original 
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puesta es reforzada ahora periódicamente, y la fuerza del reflejo gra- 
dualmente aumenta hasta que da con un valor constante, que para 
nuestro presente grado de aproximación es idéntico al originalmente 
adquirido antes de la discriminación. Si exceptuamos desviaciones Jo- 


RESPUESTAS 


TIEMPO EN HORAS 


FIGURA 58” 
RECONDICIONAMIENTO PERIÓDICO DESPUÉS DE UNA DISCRIMINACIÓN 


A: tasa en presencia de SA en la séptima hora de una discriminación, con reforza- 
miento en presencia de SD tal como viene indicado por los rasgos. B: incremento 
de tasa a medida que las respuestas son reforzadas periódicamente sin SD 


cales menores, la curva muestra una aceleración positiva suave. Debe 
compararse con la figura 28 que presenta el desarrollo original de una 
tasa constante bajo recondicionamiento periódico. 

Hay cierta evidencia de que persiste una diferencia entre S% y SP 
cuando sS%.R se refuerza de esta forma. Como sSP.R debería sentir 
el efecto del reforzamiento de s5%.R a través de la inducción, puede 
mantenerse un poco adelantado en lo que respecta a la fuerza. Los 
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pocos experimentos que se realizaron sobre este punto dieron resul- 
tados positivos en todos los casos. Se estableció una discriminación 
en la que S” era un chasquido. Luego se reforzó continuamente el 
reflejo sS%.R hasta que el impulso fue tan bajo que se interrumpió 
la provocación (ver capítulo 9). Cuando la rata no había respondido 
durante varios minutos, se presentó el chasquido. Excepto en casos 
de grado de hambre extremadamente bajo, el chasquido fue seguido 
invariablemente por una respuesta. La respuesta dejó de ocurrir en pre- 
sencia de S% aunque había sido reforzada continuamente, pero ocurrió 
inmediatamente en presencia de SD, 

En la figura 59 el reforzamiento del miembro extinguido se compara 
con el del caso de una respondiente. La comparación es arbitraria en 
varios aspectos. El tiempo que transcurre entre los reforzamientos es 
de siete minutos en el caso de la operante y de quince en el de la 
respondiente. La medida de la fuerza es la tasa de respuesta en el caso 
de la operante: y la cantidad de salivación durante un minuto en el de 
la respondiente. Los datos relativos a la respondiente son extraídos de la 


OPERANTE 


RESPONDIENTE 


GOTAS DE SALIVA 


REFORZAMIENTOS 
Ficura 59 


ABOLICIÓN DE UNA DISCRIMINACIÓN MEDIANTE EL REFORZAMIENTO PERIÓDICO 
DEL REFLEJO EXTINGUIDO 


La curva operante es la derivada aproximada de la curva B, figura 58. La línea ho- 
rizontal discontinua indica la tasa a partir de la cual se inicia el cambio. La curva 
respondiente se ha construido a partir de datos aportados por Pavlov (64), p. 81 
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obra de Pavlov (64). Se ha tomado un valor máximo de unas quince 
gotas y se ha tomado nota del principio de la desaceleración. Los datos 
referentes a la Operante se representan como la diferencial de una 
curva suave trazada a través del registro B de la figura 58. Las uni- 
dades de las ordenadas (no representadas en la figura), se han elegido 
para procurar acercar el valor máximo al de la respondiente. En este 
caso, la fuerza no empieza en cero, sino en el valor predominante en 
el día anterior, tal como viene indicado por la línea horizontal 
punteada. 

Las dos curvas difieren principalmente en la ausencia de toda acele- 
ración positiva en la curva de la operante. Cada reforzamiento eleva 
la tasa en una cantidad uniforme definida hasta que se alcanza prác- 
ticamente el valor máximo. Esto no es completamente cierto en lo que 
respecta al desarrollo original de la fuerza constante bajo recondicio- 
namiento periódico (figura 28), pero está en armonía con la noción 
de una razón de extinción constante cuando el recondicionamiento 
periódico se ha establecido una vez. La respondiente presenta cierto 
retraso en adquirir fuerza, lo cual puede deberse a la “extinción más 
allá de cero”, un efecto que es imposible en una operante. Al inter- 
pretar estas curvas debe advertirse que corresponden a casos singu- 
lares, cuya tipicidad en el caso de la respondiente es desconocida. 

El retorno ordenado a una tasa máxima constante durante el recon- 
dicionamiento periódico demuestra que el reflejo extinguido no existe 
en un estado de excitabilidad suprimida (ver más abajo) y que hacia 
el final de la discriminación su reserva, como la tasa indica, se halla 
casi agotada. 


El estado del reflejo reforzado 


La tasa de provocación del reflejo reforzado durante la discrimi- 
nación depende de la tasa de presentación del estímulo discriminativo 
y, por lo tanto, no es de ningmma utilidad a la hora de medir la fuerza. 
Pero existen otros medios para explorar el estado del reflejo. En una 
operante discriminada transcurre un cierto tiempo entre la presenta- 
ción de SP y la ocurrencia de la respuesta, lo cual recuerda la latencia 
de una respondiente y, por extensión, puede también llamarse laten- 
cia. Esta latencia nos proporciona cierta medida (aunque posiblemente 
una medida discutible) de la fuerza del reflejo reforzado durante una 
discriminación. El primer cambio a observar es el acortamiento de la 
latencia a medida que el reflejo reforzado aumenta de fuerza desde 
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el valor intermedio predominante durante el recondicionamiento pe- 
riódico hasta un valor esencialmente máximo. El cambio tiene lugar 
rápidamente, pero no puede seguirse con facilidad. Antes de que el 
reforzamiento en presencia de SP haya surtido efecto alguno, la “la- 
tencia” será una cuestión aleatoria y dependerá de la tasa media de 
la respuesta en aquel momento. Como las respuestas no están distri- 
buidas uniformemente, el valor aleatorio real no puede calcularse a 
partir de la tasa. El elemento de azar confunde el curso del cambio de 
la latencia en el primer día de una discriminación. Un grupo de dieci- 
séis ratas en un experimento que será descrito en el capítulo siguiente, 
dieron como latencias medias para las nueve primeras presentaciones 
(sin contar la latencia del principio del experimento): 13.38, 11.84, 
7.69, 8.25, 9.82, 5.76, 4.07, 6.38 y 8.88 segundos. Las cifras muestran 
una dispersión considerable a pesar de la muestra relativamente gran- 
de, y lo único que indican es que la parte mejor del cambio se realiza 
en los dos primeros reforzamientos. El nivel medio puede descender 
lentamente durante los días sucesivos del experimento, como ya mos- 
traremos más tarde (figura 70). 

Existen diferencias considerables entre las latencias de las respues- 
tas discriminativas a los estímulos auditivos y visuales en las intensi- 
dades usadas en estos experimentos. En un experimento se establecieron 
discriminaciones en un par de ratas con reforzamiento periódico en 
presencia de una luz cada cinco minutos. Cuando la latencia se hubo 
estabilizado, se tomaron mediciones de una precisión de hasta un 
quinto de segundo durante tres períodos diarios sucesivos de una hora. 
Al día siguiente, la luz se sustituyó por un zumbador como fuente de 
estímulo discriminativo. La transferencia de un estímulo a otro se llevó 
a cabo fácilmente, aunque la respuesta investigatoria al nueva estímulo 
produjo unas pocas latencias de larga duración el primer día. Al se- 
gundo y tercer días se efectuaron mediciones de las latencias con el 
zumbador. Se registraron dos días más con la luz y luego dos más con 
el zumbador. Así, pues, para cada rata resultaron cinco series de laten- 
cias con la luz y cuatro con el zumbador. Cada serie consistía en once 
latencias, puesto que la primera latencia de cada hora quedaba oscu- 
recida por la puesta en libertad de la rata dentro de la caja. El pro- 
medio de todas las latencias en respuesta a la luz fue de 5.12 
segundos; en respuesta al zumbador, de 1.97 segundos. Ambas ratas 
mostraron una diferencia de esta magnitud y no se produjo superpo- 
sición alguna en las gamas de los promedios diarios. Este resultado se 
ha confirmado por observación asistemática en todos los otros experi- 
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mentos sobre discriminación; la latencia en respuesta a un sonido es 
considerablemente más breve que la latencia en respuesta a una luz. 


Esta diferencia puede deberse más a la intensidad que a diferencias 
cualitativas de los estímulos. La diferencia es bastante grande como 
para sugerir una experimentación más detallada sobre la relación exis- 
tente entre la latencia y la intensidad así como sobre una comparación 
de las gamas obtenidas con intensidades máximas y mínimas en modali- 


dades diferentes. En el capítulo 6 proporcionamos más datos sobre las 
latencias discriminativas. 


Ahora tenemos que pasar de la cuestión de la mera fuerza a la de 
la reserva. Durante una discriminación se extingue sS%.R mientras 
que se incrementa sSP. R hasta una fuerza casi máxima. ¿Pero qué su- 
cede a la reserva de sSP, R? ¿Es aún válido el principio de la razón de 
extinción, y, en virtud del procedimiento del recondicionamiento pe- 
riódico, estamos construyendo una tremenda reserva que no puede en- 
contrar expresión a causa de la presentación limitada de SP? La pre- 
gunta puede responderse simplemente extinguiendo sSP.R después de 
haber establecido una discriminación. 


En un experimento realizado para verificar este punto se establecie- 
ron discriminaciones de la forma usual en un grupo de ocho ratas. SP 
era una luz y el intervalo de presentación y reforzamiento periódi- 
cos era de seis minutos. Al séptimo día sS2. R había alcanzado un valor 
bajo. El registro A de la figura 60 constituye un ejemplo típico de la 
tasa obtenida en aquel momento, en que las barras verticales indican 
las respuestas reforzadas. El registro B fue tomado el día experimental 
inmediatamente siguiente, o en el octavo día de la discriminación. Du- 
rante 48 minutos se efectuaron el recondicionamiento periódico usual 
de sSP.R y la extinción intermedia de sS%,R. La tasa no muestra en 
este día ningún descenso posterior apreciable. Tras el octavo intervalo 
se presentó continuamente SP y no se reforzó ninguna de las respuestas 
subsiguientes. 


La curva de extinción típicamente obtenida en un experimento de 
este tipo es relativamente pequeña. Su área es, por lo general, conside- 
rablemente menor que la de una curva de extinción original obtenida 
después de cincuenta reforzamientos y mucho menor que la de cualquier 
curva después de recondicionamiento periódico. Muestra un rápido lim- 
bo ascendente, similar a una curva de extinción original, y presenta 
sólo ligeras huellas de fluctuación cíclica. La curva de la figura 60 es 
típica, si exceptuamos que puede ser ligeramente mayor que la media. 
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Podría avanzarse la explicación siguiente sobre la imposibiladad de 
obtener una curva de extinción mayor, explicación que no obstante es 
inválida. Ya mostraremos más tarde que el cambio de SP a S% puede 
adquirir las propiedades de un estímulo discriminativo en que SP o $2, 
considerados separadamente, son ineficaces. Por lo tanto, podría soste- 
nerse que al presentar SP continuamente en este experimento, de hecho 
no mantenemos el mismo estímulo discriminativo que previamente se 


RESPUESTAS 


TIEMPO EN HORAS 


FiGuURA 607 
EXTINCIÓN DEL REFLEJO REFORZADO EN UNA DISCRIMINACIÓN 


A: la tasa en presencia de S% en la séptima hora de una discriminación. B: la 
octava hora de la discriminación, en que SD se presentó continuamente, a partir 
de la línea punteada, pero no fue reforzado 


correlacionó con el reforzamiento. El estímulo podría haber sido el cam- 
bio de S% a SP en vez del mismo SP. Ya mostraremos más tarde, sin 
embargo, que el punto en el que únicamente el cambio es por sí mismo 
efectivo debe alcanzarse a un procedimiento especial. Además, 
puede obtenerse el mismo resultado con un estímulo discontinuo. La 
figura 61 consiste en un registro de un experimento de este tipo. En 
este caso el estímulo discriminativo era el sonido de un, chasquido, que 
no persistía hasta el reforzamiento. En el experimento representado 
en la figura 61 se había establecido una discriminación reforzando una 
respuesta discriminada cada quince minutos (un intervalo relativamente 
largo). El día representado en la figura se reforzó una respuesta dis- 
criminada al principio del período y después de quince minutos. El 
registro muestra cierta recuperación espontánea al inicio de la ahora, 
seguido de una baja tasa de respuesta. Después de treinta minutos el 
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chasquido se presentó cada dos minutos sin reforzamiento. La primera 
presentación ocasionó bastantes respuestas, la segunda unas pocas y, a 
medida que progresó el experimento, la tasa declinó considerablemente 
como en el experimento precedente. Hacia el fin del período la tasa 
era tan baja que algunas presentaciones del estímulo no fueron seguidas 
de respuestas. El área de la curva es de un orden comparable al obte- 
nido con un estímulo continuo, siendo éste un resultado típico. 

Está claro que el reforzamiento periódico de sSP. R durante una dis- 
criminación no está funcionando para crear una reserva del reflejo tal 
como cabría esperar de la noción de extinción en el recondicionamiento 


TIEMPO EN MINUTOS 


FicGurA 61 


EXTINCIÓN DEL REFLEJO BEFORZADO EN UNA DISCRIMINACIÓN EN QUE EL ESTÍMULO 
DISCRIMINATIVO ES MOMENTÁNEO 


La curva de la parte superior de la línea discontinua es comparable a la de la 
figura 60, si exceptuamos que SD (un chasquido) se presentó cada dos minutos sin 
reforzamiento 


periódico simple. Pero eso es lo que cabe esperar. Ya hemos señalado 
que la razón de extinción no se mantiene cuando Nc es mayor que l, 
Unos cuantos reforzamientos distribuidos periódicamente incrementarán 
la reserva enormemente más allá de todo posible aumento conseguido 
a partir de la misma cantidad de reforzamiento continuo. En el expe- 
rimento presente, sSP.R no se refuerza periódicamente en el sentido 
en que ese término se ha usado en el capítulo anterior. Es característi- 
co del recondicionamiento periódico el hecho de que algunas respuestas 
debieran no ser reforzadas; el reforzamiento periódico es recondicio- 
namiento. En una discriminación reforzamos todas las respuestas a SD 
y no cabe esperar la creación de una reserva muy considerable. Por 
Otra parte, tenemos que tomar en cuenta un efecto inductivo que tien- 
de a reducir la reserva, sea cual sea. La curva de extinción obtenida 
para sS? . R al final de una discriminación es, muchas veces, más peque- 
ña de lo que hubiera sido si se hubiese obtenido al inicio del proceso. 
Seguidamente presentaremos otros ejemplos de extinción inductiva. 
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La discriminación sin recondicionamiento periódico previo 


Hemos visto que la “curva de discriminación” obtenida con el mé- 
todo que acabamos de exponer no era más que la curva de la extinción 
de sS2.R y que sólo comporta una dudosa huella del efecto de la in- 
ducción. Es posible modificar la curva reduciendo la reserva inicial que 
será agotada a través de la extinción. Un método consiste en prescindir 
del recondicionamiento periódico precedente y empezar simplemente 
con el reforzamiento continuo de sSP,R. Se obtiene una curva mucho 
más pequeña, y toda inducción de SP a SA queda revelada mucho más 
claramente. 

En un experimento de este tipo se condicionaron cuatro ratas de la 
forma usual en presencia de una luz y se reforzaron cincuenta respues- 


RESPUESTAS 


K— 60 MINUTOS 


Ficura 62 15 
DISCRIMINACIÓN SIN REFORZAMIENTO PERIÓDICO PREVIO 


Cuatro primeros registros de una rata 


tas. Al día siguiente se extinguió el reflejo, tanto en la luz como en la 
oscuridad. Entonces las ratas se sometieron al procedimiento discrimi- 
nativo sin recondicionamiento periódico. En la figura 62 (pág. 217) re- 
producimos un conjunto de registros típicos. El primer registro muestra 
cierta convexidad al principio, que es debida a la recuperación espon- 
tánea e la extinción el día precedeten. La recuperación es lo bas- 
tante grande como para conferir a la curva parte del carácter de la 
figura 85, a saber, una curva de extinción seguida de una aceleración 
significativa. Se produce un descenso subsiguiente de tasa que conti- 
núa durante los próximos cuatro días. En el cuarto registro se produce 
un arranque anómalo de actividad poco después del principio, y el 
número total de respuestas del día es, por tanto, elevado. Las series com- 
pletas correspondientes a las cuatro ratas y sus promedios (la línea 
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gruesa) vienen dadas en la figura 63 (pág. 218). La serie de la figura 62 
está marcada con una D. Si comparamos esas figuras con las figuras 54 y 
55 podemos ver que, en el presente caso, una considerable diferencia 
de fuerza entre los dos reflejos se anula más rápidamente. La diferen- 
cia no consiste en una “capacidad para la discriminación”, sino en la 
reserva original que necesita ser extinguida. 


RESPUESTAS 


DÍAS 


FiGuRA 63 15 
DISCRIMINACIÓN SIN REFORZAMIENTO PERIÓDICO PREVIO 


Se representan cuatro series de registros, así como su promedio, La curva D co- 
rresponde a la figura 62 


En este experimento hay una clara evidencia de inducción y del 
cambio de su [influencia durante el proceso. Las curvas son mayores de 
lo que cabría esperar de la mera extinción de una reserva previamente 
establecida, porque la reserva se agotó casi antes del inicio de la dis- 
criminación. La tasa relativamente alta desarrollada el primer día del 
experimento corresponde a sS%, R, que nunca ha sido reforzado. Su fuer- 
za y reserva se deben parcialmente a la inducción del reforzamiento 
continuo de sSP . R, cuyo efecto no ha sido erradicado enteramente du- 
rante la extinción precedente. Esto queda demostrado por la recupe- 
ración espontánea que tiene lugar en el inicio de los registros. La 
aceleración positiva del primer día no puede deberse a la recupera- 
ción, sino que tiene que ser el resultado del reforzamiento concurrente 
de sSD.R. La prueba de la inducción concurrente no fue concluyente 
en el experimento después de recondicionamiento periódico, pero en 
el presente caso está fuera de toda duda. A medida que avanza el ex- 
perimento, la inducción decrece en amplitud (de lo contrario se man- 
tendría la máxima pendiente observada), y el último estado presumi- 
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blemente se caracteriza por una inducción nula y, por lo tanto, por la 
ausencia de la ocurrencia del reflejo no reforzado. En el experimento 
siguiente se indica una inducción inicial similar y su desaparición final. 


Discriminación sin condicionamiento previo 


El tiempo requerido para establecer una discriminación relativamen- 
te completa depende de la reserva inicial del reflejo a extinguir. La 
reserva puede reducirse todavía más que en el experimento anterior 
si empezamos la discriminación después del reforzamiento de una sola 
respuesta. Para ello es necesario manejar fuerzas relativamente bajas, 
en que es probable que factores extraños introduzcan irregularidades, 
pero la conducta del presente caso es satisfactoriamente uniforme. 

Se sometió a ocho ratas al entrenamiento de costumbre antes del 
condicionamiento. Describiré el procedimiento subsiguiente en relación 


RESPUESTAS 


k—— 60 MINUTOS  —— 


Ficura 64 12 


DISCRIMINACIÓN SIN CONDICIONAMIENTO PREVIO 


Registros de cinco días sucesivos empezando por la parte superior. Se reforzaron 
las respuestas en los puntos señalados en el gráfico en presencia de un estímulo 
discriminativo. Durante el tiempo restante el estímulo se hallaba ausente y no se 
reforzó ninguna respuesta. Se observó una inducción de SD a SA escasa O nula 
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con el resultado típico mostrado por una rata en la figura 64 (pág. 219), 
a lo largo de cinco días sucesivos. Al soltar la rata el primer día, la luz 
estaba encendida. Se produjo rápidamente una respuesta a la palanca, 
respuesta que fue reforzada. Entonces se desconectaron la luz y el 
almacén. Muy probablemente ocurrió cierto condicionamiento de sSP, R. 
Si hubiera un efecto inductivo sobre sS2%. R, en ausencia de la luz se 
hubiese producido una curva de extinción. En realidad, sólo se efectua- 
ron dos respuestas durante los cinco minutos siguientes, y es difícil 
decir si revelan inducción o son similares a la primera respuesta. Cuan- 


RESPUESTAS 


k— 60 MINUTOS  -——>l 


FiGuRA 65 1 
DISCRIMINACIÓN SIN CONDICIONAMIENTO PREVIO 


Esta figura es semejante a la figura 64 y muestra la mayor cantidad de inducción 
en ocho casos 


do se encendió de nuevo la luz, la rata respondió después de 39 segun- 
dos (en la segunda señal que muestra el primer registro de la figura). 
Entonces se desconectaron otra vez tanto la luz como el almacén, y ocu- 
rrieron dos respuestas más en la oscuridad durante los cinco minutos 
siguientes. Este procedimiento se repitió durante una hora y media, 
con el resultado mostrado en la figura. Hacia el séptimo reforzamiento, 
la latencia de sSP. R había alcanzado un valor más o menos estable de 
unos 20 segundos, que se mantuvo a lo largo del resto del experimento. 

La fuerza de sS%. R se incrementó ligeramente gracias a la inducción 
durante la primera hora y media hasta dar una tasa de respuesta de 
unas cuatro respuestas por reforzamiento. Al día siguiente descendió 
de nuevo a un promedio de unas dos respuestas y continuó declinando 
cuando la discriminación se hizo más efectiva. Al tercer día apareció 
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espontáneamente una curva de extinción después del cuarto reforza- 
miento y se observó un efecto semejante en otros dos casos. Parece como 
si la respuesta en este punto se hiciera en ausencia de la luz —o sea, 
como si el reforzamiento se aplicara a sS% . R. Este efecto anómaló pue- 
de explicarse suponiendo o bien que la rata se hallaba respondiendo 
a S% cuando se encedió la luz, o bien que respondió a la palanca en 
presencia de la luz, pero de tal forma que la luz no constituyó una 
parte efectiva del estímulo total. En apoyo de esta explicación se han 


RESPUESTAS 


k— 60 MINUTOS —>| 


Ficura 66 Y 
DISCRIMINACIÓN SIN CONDICIONAMIENTO PREVIO 


Compárense las figuras 64 y 65, Una inducción inversa de SA a SD casi elimina 
el reflejo en el segundo día (segundo registro empezando por arriba) 


obtenido curvas bastante similares, permitiendo que un reforzamiento 
tuviera lugar en la oscuridad. Esto se hizo en las flechas de los últimos 
registros de las figuras 64 y 66. En contraste con las curvas espontá- 
neas, la extinción empieza en esos dos casos sólo después de un retraso 
de aproximadamente tres minutos. 

Sea cual sea la explicación de este efecto, no influye seriamente so- 
bre la conclusión de que si el procedimiento de la discriminación se 
instituye antes de que uno y otro miembro hayan sido condicionados, 
la discriminación puede considerarse como esencialmente completa 
desde el principio. Esto no es más que la confirmación final de la pre- 
sente interpretación del proceso. 
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El experimento muestra asimismo que, en algunos casos, el efecto 
inductivo puede ser muy ligero. La figura 64 es típica de seis de los 
ocho casos. Entre los seis, la máxima inducción se observó en el caso de 
la figura 65. (Esta serie se interrumpió el tercer día debido a un fallo 
técnico.) La inducción mínima se observó en los dos restantes casos, 
en los que una inducción en sentido opuesto acarreó la pronta desapa- 
rición de todas las respuestas. En la figura 66 una extinción inductiva 
semejante por poco terminó con la serie en la última parte del segundo 
registro, en que descendió considerablemente la fuerza de sSP.R (me- 
dida a partir de su latnecia). Al día siguiente se produjo una recupe- 
ración adecuada, aunque la latencia de la serie entera era consistente- 
mente alta, con un promedio de 41,0 segundos en lugar de 15,5 segundos 
para las otras cinco ratas. La latencia media de 19,7 segundos para todas 
las seis ratas es aproximadamente el triple de la latencia observada 
con los métodos precedentes e indica que con este método la extin- 
ción de sS%.R tiene, en general, un efecto más acusado sobre la fuerza 
de sSD,R, 

Para controlar cualquier diferencia incondicionada en la tasa de res- 
puesta en presencia y ausencia de la luz, la mitad de los casos anteriores 
fueron, en realidad, del tipo opuesto. El experimento de la figura 64 se 
efectuó de la forma descrita, pero en las figuras 65 y 66, SD fue la ausen- 
cia de luz y S* su presencia, Los dos casos en que la tasa descendió has- 
ta cero, bajo la inducción negativa, fueron del tipo de la luz encendida 
en el reforzamiento, y ello concuerda bien con la evidencia que vamos a 
considerar acto seguido de un efecto depresivo de la luz. Ocho casos 
no son suficientes para establecer la completa indiferencia de esta con- 
dición para el presente resultado, pero es evidente que no se experimenta 
un efecto muy grande. 


Una tentativa para detectar inducción 
en un estadio tardío de discriminación 


El efecto de la inducción presumiblemente podría comprobarse com- 
parando curvas de discriminación en que se variaran las tasas de refor- 
zamiento periódico de sSP . R, La elección de cinco o seis minutos como 
intervalo entre los reforzamientos de sSD.R es puramente arbitraria, y 
puede mantenerse una fuerza adecuada de sS” . R con un reforzamiento 
mucho menos frecuente. En el experimento siguiente esto queda demos- 
trado incidentalmente, consistiendo este experimento en un intento de 
detección de la presencia de la inducción en los estadios tardíos de uma 
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discriminación al variar el número relativo de reforzamientos. Se alcanzó, 
rápidamente, un estado avanzado de discriminación empezando sin re- 
condicionamiento periódico previo, reforzando sSP.R sólo cada quince 
minutos, y prolongando el período diario experimental hasta dos horas. 
El aparato se dispuso de tal forma que fuera posible reforzar dos res- 
puestas sucesivas tras la presentación de SP (un chasquido). En dos de 
los cuatro casos se reforzaron dos respuestas de esta forma durante el 
desarrollo temprano de la discriminación. En los otros dos casos se re- 


RESPUESTAS POR 2 HORAS 


PERÍODO DIARIOS DE DOS HORAS CADA UNO: 


FiGura 67 
INDUCCIÓN EN UNA DISCRIMINACIÓN SIN REFORZAMIENTO PERIÓDICO PREVIO 


El reforzamiento de dos respuestas a cada presentación de SD, en lugar de re- 
forzar una sola, aumenta la tasa de respuesta en presencia de S2, El doble reforza- 
miento queda mostrado por ”-—2” 


forzó una respuesta como de costumbre. Al cabo de seis días (doce horas 
de experimentación) la tasa media de sSP.R había alcanzado el bajo 
valor de unas treinta respuestas por hora. Entonces se invirtieron las 
condiciones de tal forma que el primer par recibiera solamente un refor- 
zamiento único cada quince minutos y el segundo recibiera un reforza- 
miento doble. Después de cinco días (diez horas) las condiciones origi- 
nales quedaron restablecidas a lo largo de los cuatro días posteriores. 

El resultado aparece en la figura 67 en que se han promediado las 
cantidades de respuestas emitidas durante dos horas por cada par. Al 
igual que en el experimento citado anteriormente sobre discriminación 


sin recondicionamiento periódico previo, se alcanza una tasa de res- 
puesta bastante alta para sS5%.R mediante la inducción concurrente 
de sSP.R, incluso a esta tasa baja de reforzamiento. La tasa es casi el 
doble para el grupo que recibe un reforzamiento doble. Aunque esto 
puede deberse en parte al muestreo, la conducta subsiguiente indica 
que las diferencias individuales no pueden explicarlo todo y que tie- 
ne que ser debido a una mayor inducción en el caso del reforzamiento 
doble. Como $? no persiste hasta el reforzamiento, las respuestas refor- 
zadas del primer día, con sus largas “latencias”, fueron prácticamente 
sSA . R y el efecto es directo más que inductivo. Las tasas descienden con 
rapidez aproximadamente hasta el mismo nivel al cabo de seis días, 
indicando que las curvas son de extinción, y muestran una persistencia 
de inducción escasa o nula. Cuando las condiciones se invierten, sin 
embargo, los valores del par que ahora recibe doble reforzamiento su- 
ben considerablemente por encima de los del grupo reforzado una sola 
vez, y cuando se invierten de nuevo las condiciones tiene lugar un cam- 
bio similar. En la tabla 8 damos los promedios y las desviaciones nor- 


TABLA 8 

Días 7-11 12-15 
Grupo A cocino. (1) 26,33 (2 47434 
Grupo Boo... (2) 389465 (1) 28463 


males en las respuestas por hora correspondientes a los dos grupos en 
las dos últimas partes del experimento. Los números entre paréntesis 
indican el número de respuestas reforzadas periódicamente. Aunque 
las muestras son pequeñas (dos ratas en cada grupo) y las desviaciones 
normales bastante grandes, se indica una tasa superior de respuesta 
para sS2.R cuando sS>.R se refuerza dos veces en lugar de una en 
cada intervalo. 

El resultado no supone un signo categórico de inducción en los es- 
tadios tardíos de una discriminación porque implica otro cambio en la 
conducta de la rata. Los dos reforzamientos sucesivos plantean un nue- 
vo problema, que ya he mencionado, en relación con la naturaleza en- 
cadenada de esta muestra de conducta. Al reforzar dos respuestas des- 
pués de la presentación del chasquido, establecemos dos estímulos 
discriminativos: sSD: chasquido (correlacionado con el primer reforza- 
miento) y sSP: chasquido S*”: reforzamiento de la respuesta precedente 
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(correlacionado con el segundo). El reflejo sSP 58D”. R se hace tan fuerte 
que predomina sobre la respuestas al comedero y es evocado antes 
de que la rata capture y coma el primer gránulo. Ahora bien, parte de 
SP” es el mero acto de pulsar la palanca, y esto puede ser responsable del 
aumento de la tasa en presencia de S”. Bajo el procedimiento de refor- 
zar dos respuestas de forma sucesiva, es necesariamente cierto que la 
estimulación propioceptiva de una respuesta a la palanca está correla- 
cionada ocasionalmente con el reforzamiento de una respuesta subsi- 
guiente. De ahí que las respuestas ocasionales de la rata a S24 puedan 
suministrar lo suficiente de un SP efectivo como para ser responsables 
de un aumento de tasa. Este fallo puede corregirse hasta cierto punto 
usando un SP que persista durante el reforzamiento, lo cual no sucedía 
con el chasquido, pero siempre seguirá siendo una objeción, hasta cierto 
punto, para el uso de los datos con el propósito para el que se obtuvieron 
aquí. Variar la tasa de reforzamiento en lugar del número reforzado 
en cada ocasión es, probablemente, el mejor método, aunque también 
se ve sometido a ciertos efectos perturbadores. Este experimento alter- 
nativo todavía no se ha realizado. 


Las “latencias” de sS.R en el primer día de este experimento son 
interesantes. El primer valor (para el segundo reforzamiento, puesto 
que el valor en el momento de la puesta en libertad carece de sentido) 
es de 9 minutos y 15 segundos. Los valores subsiguientes descienden 
con cierta regularidad de la forma siguiente: 4:31, 4:00, 1:08, 1:52, 
0:52 y 0:11. Con muchos métodos de medición de la discriminación 
esto sería aceptado como una curva de discriminación. Pero la primera 
parte de la curva muy probablemente no es debida, en absoluto, al des- 
arrollo de una discriminación, ya que muy poco efecto podría prevale- 
cer cuando el chasquido es seguido por una respuesta reforzada sólo 
después de 9 minutos. El descenso de la “latencia” es el resultado del 
aumento de la tasa de respuesta debido al reforzamiento prácticamente 
directo de sS%.R y constituye simplemente un cambio en la probabili- 
dad de que un chasquido sea seguido en tal o cual momento por una 
respuesta. Si el valor al cabo de dos horas (11 segundos) es una verda- 
dera latencia discriminativa, ello tiene que significar que un reforzamien- 
to, después de 52 segundos, es capaz de establecer la conexión requeri- 
da. Al día siguiente los valores eran demasiado bajos para ser explicados 
en función de la tasa de respuesta y, evidentemente, representaban ver- 
daderas latencias discriminativas. 


(8) 
10 
al 
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La inversión de una discriminación 


Ahora voy a pasar a considerar otras dos propiedades de la induc- 
ción y otro tipo de estímulo discriminativo al mismo tiempo, examinando 
la forma en que una rata adquiere una segunda discriminación, en la 
cual las condiciones de la correlación del estímulo reforzante son pre- 
cisamente las inversas a las de la primera. Por ejemplo, si SP ha sido 
una luz y 5% la ausencia de la luz, se obliga a la rata a invertir su con- 
ducta previa convirtiendo la luz en S% y su ausencia en SD, 

En este experimento la designación en forma de exponente del ca- 
rácter del estímulo, con respecto a su correlación con un reforzamiento, 
no puede seguir utilizándose para implicar la presencia de una propie- 
dad del mismo estímulo. Por consiguiente, voy a especificar la propiedad 
y el estímulo discriminativo. Así, SP 1= luz correlacionada con refor- 
zamiento; SA l= luz no correlacionada; SPA = ausencia de luz corre- 
lacionada con reforzamiento; S%A = ausencia de luz no correlacionada 
con reforzamiento. El procedimiento que se emplea el día de la inver- 
sión es el siguiente: La primera respuesta se produce en la oscuridad y 
es reforzada; entonces se enciende la luz durante cinco (o en algunos 
de los experimentos siguientes, seis) minutos y no se refuerza ninguna 
respuesta. Entonces se apaga la luz, se refuerza la próxima respuesta y 
se enciende de nuevo la luz; este procedimiento se repite durante lo 
que resta de la hora. 

Debería ser posible predecir los aspectos principales de la conducta 
de la rata, el día de la inversión, partiendo de lo que ya sabemos. Tras 
el desarrollo de una discriminación se obtiene una curva de extinción 
que presenta ciertas propiedades características si el estímulo previa- 
mente reforzado se presenta continuamente sin reforzamiento. Con ex- 
cepción de los breves períodos de SPA, que ocurren cada cinco o seis 
minutos, la luz está encendida continuamente después de la inversión, 
y al principio del día de la inversión debería aparecer una curva de 
extinción para la respuesta a la luz. La curva no tiene por qué tener 
un área tan grande como una curva de extinción original. Partiendo de 
dicha curva debiera aparecer una curva de aceleración positiva debida 
a la inducción del reforzamiento periódico de sS$PA.R. Las curvas de 
esos dos tipos se suman algebraicamente cuando existen simultáneamen- 
te las condiciones para su desarrollo, como ya se mostró en la figura 35, 
pero la curva compuesta del día de la inversión debería presentar una 
modificación. La curva de aceleración positiva debiera acercarse a la 
curva de aceleración negativa a lo largo de la cual va a desarrollarse 
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la nueva discriminación. En la figura 35 no fue posible discriminación 
alguna, puesto que correspondía a un recondicionamiento periódico 
simple, pero en el presente caso sí cabe esperarla. La curva resultante 
debería componerse, al menos, de tres partes separadas. A pesar de su 
complejidad, en realidad se obtiene experimentalmente. 

Se sometió a un grupo de ocho ratas machos, de unos 110 días de 
edad al principio del experimento, al procedimiento de la discrimina- 
ción con un intervalo de recondicionamiento de seis minutos. Al sexto 
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FiGuURA 68 15 
Curvas COMPUESTAS OBTENIDAS DURANTE LA INVERSIÓN DE UNA DISCRIMINACIÓN 


Las curvas inferiores corresponden al último día de la discriminación original. Las 
curvas superiores se obtuvieron cuando convirtió SD en SA y viceversa. Cada 
curva contiene: 1) la extinción de la respuesta en presencia del estímulo anterior 
SD (cf. figura 60); 2) la aceleración positiva en presencia de SA debida a la induc- 
ción (cf. figura 63), y 3) la aceleración negativa de la nueva discriminación 


día de la discriminación se invirtieron las condiciones. En la figura 68 
presentamos dos registros correspondientes al día de la inversión. Los re- 
gistros Al y B1 corresponden al séptimo día de la discriminación. Los 
registros A2 y B2 se refieren al día de la inversión, y muestran las ca- 
racterísticas predichas. Empiezan con curvas de extinción, pero éstas 
son interrumpidas por curvas de aceleración positiva, las cuales con- 
ducen a aceleraciones negativas a medida que las nuevas discriminacio- 
nes se desarrollan. Se trata de registros típicos. El resultado puede ser 
menos claro cuando la tasa no logra volver a su pleno valor bajo re- 
condicionamiento periódico (dos de los ocho casos en el presente expe- 
rimento), pero teniendo en cuenta la naturaleza de esas excepciones 
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(ver más adelante), no debieran afectar la correspondencia con las for- 
mas predichas. 

En la figura 69 se reproducen cuatro registros típicos de la totalidad 
del proceso. Dichos registros se obtuvieron representando gráficamente 
los puntos finales de los registros diarios y copiando los registros in- 
termedios a mano. En los tres primeros días de la figura las ratas se 
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DIAS 
Ficura 69? 
INVERSIONES SUCESIVAS DE UNA DISCRIMINACIÓN 


En cada inversión, SD se convirtió en SA, y viceversa. Se muestran tres inversiones, 
en la segunda, tercera y cuarta líneas verticales. Las tasas bajo reforzamiento pe- 
riódico vienen dadas al principio y al fin 


sometieron a recondicionamiento periódico a intervalos de seis minutos. 
Al cuarto día (en la línea vertical discontinua) se dio comienzo al pro- 
cedimiento discriminativo, y los próximos siete días muestran el des- 
arrollo de la discriminación. Las desviaciones menores de esos registros 
se parecen a las antes descritas (pág. 202). Los registros diarios Al y Bl 
de la figura 68 vienen entre corchetes en la presente figura. En la se- 
gunda línea discontinua se invirtieron las condiciones. Asimismo los 
registros detallados A2 y B2 de la figura 68 están entre corchetes. En 
las otras dos curvas el retorno a la pendiente periódica es más lento y 
nunca llega a desarrollarse plenamente, pero las características de los 
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registros de la inversión son evidentes, pese a la considerable reducción 
requerida por la figura. Los cinco días siguientes muestran el desarrollo 
de la segunda discriminación, al término de la cual la tasa de provoca- 
ción del miembro extinguido ha alcanzado un valor bajo. (Como adver- 
tiré más tarde, no es tan bajo como al fin de la primera discriminación.) 

Las curvas obtenidas en la discriminación invertida deberían tener 
algunas de las propiedades anteriormente mostradas en la figura 62 y 68. 
La ligera convexidad que presenta la segunda de ellas es debida a 
cierta recuperación espontánea de la extnición. Aquí la convexidad 
corresponde a la extinción después de una discriminación. En ambos 
conjuntos, toda aceleración positiva tiene que deberse a la inducción 
concurrente y, por consiguiente, la pendiente máxima y el área de la 
curva no será tan grande como la observada después de recondiciona- 
miento periódico. En el presente caso, las áreas de las primeras y se- 
gundas curvas debieran diferir por la cantidad aportada a las primeras 
por el recondicionamiento periódico que las precedió y cuya contra- 
partida no se hallaba en las segundas. La curva original incluye la ex- 
tinción del efecto de tres horas de recondicionamiento periódico; la 
curva invertida incluye, además de la extinción de la respuesta a la luz, 
solamente la parte del efecto inductivo que puede tener lugar antes 
de que la inducción se descomponga en la nueva discriminación. Como 
las áreas no son comparables, el efecto más significativo de la inversión 
es la forma de los registros del primer día, lo cual revela de forma bas- 
tante clara la naturaleza del cambio que tiene lugar. 


Otro importante efecto de la inversión se observa en el estado del 
reflejo reforzado. Como en los experimentos precedentes, puede obte- 
nerse información sobre el estado de este reflejo a partir de su latencia, 
que se mide (en el presente caso con la precisión de un segundo) como 
el intervalo que transcurre entre la introducción de la luz y la aparición 
de la respuesta. La latencia alcanza un valor relativamente estable el 
primer día de la discriminación, y el promedio de este día está muy por 
debajo del valor aleatorio medio obtenido bajo recondicionamiento pe- 
riódico. Posteriormente, se produce un descenso diario más lento, lo 
cual puede persistir hasta cierto punto a lo largo de todo el experimen- 
to (al menos durante treinta días). 

Las latencias medias de las ocho ratas en el presente experimento 
(nueve latencias por rata y por día) son representadas por los círculos 
en blanco de la figura 70. La serie de la discriminación original empie- 
za en el valor ya reducido de 9.2 segundos. Durante los dos o tres días 
siguientes se observa un descenso significativo. Después de la inversión 
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se mide la latencia para la respuesta en la oscuridad (SPA. R) que ha 
sido extinguida previamente y que, por lo tanto, tiene una fuerza muy 
baja. La latencia empieza a un valor extremadamente alto; la media 
del primer día es de 46.0 segundos. El recondicionamiento es lento, y 
el efecto de la extinción previa es todavía visible el segundo día en que 
la latencia ha descendido hasta 15,5 segundos. Al tercer día, no obstan- 


DISCRIMINACIÓN ORIGINAL 
PRIMERA INVERSIÓN 
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FIGURA 70 15 
“LATENCIAS” DE LAS RESPUESTAS DISCRIMINATIVAS DURANTE LAS INVERSIONES 


En la figura aparecen dos conjuntos de datos. La latencia disminuyó ligeramente 

durante la discriminación original. En la primera inversión se obtuvieron latencias 

de SD (previamente SA) extraordinariamente largas. En la segunda inversión no se 
produjo ningún alargamiento de las mismas 


te, la fuerza alcanza aproximadamente el valor mantenido por el reflejo 
reforzado en la discriminación original y, posteriormente, continúa apro- 
ximadamente a ese valor, 


Si ahora invertimos la discriminación por segunda vez, por supuesto 
volvemos a la serie de condiciones originales. No parece haber razón 
alguna para esperar a priori que esto no implicará otra curva compleja 
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del tipo ya obtenido. Ahora se ha recondicionado la respuesta en la 
oscuridad y debiera extinguirse, aunque la curva de extinción podría 
ser considerablemente menor. La respuesta en la luz posee una fuerza 
muy baja y debería volver esencialmente a su fuerza bajo recondicio- 
namiento periódico. El resultado experimental, no obstante, sin excep- 
ción de ningún tipo, no muestra los efectos citados de una segunda 
inversión. En el experimento presente la inversión se hizo después de 
que la nueva discriminación hubiera estado en vigor durante cinco 
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TIEMPO (UNA HORA) 
Ficura 71% 


La SEGUNDA INVERSIÓN DE UNA DISCRIMINACIÓN 


Registros individuales de la figura 69 que no muestran efecto alguno en una 
segunda inversión comparable al de la primera inversión mostrado en la figura 68 


días. En la figura 71 reproducimos dos pares de registros de los días 
inmediatamente anterior y posterior al segundo cambio, y su posición 
en la figura 69 viene indicada por corchetes. Al comparar esos re- 
gistros con la figura 68, es evidente que no hay ningún aumento ini- 
cial de tasa, el día de la inversión, que pudiera considerarse como una 
curva de extinción para el reflejo previamente reforzado, de la misma 
forma que no hay ninguna aceleración positiva con descenso de tasa 
subsiguiente. Puede detectarse un ligero efecto promediando el número 
total de respuestas por hora de los ocho registros. Los promedios de 
los tres días anteriores a la segunda inversión y de los dos días siguien- 
tes a ella son: 


... 96, 92, 88 || 95, 79 ... 
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Hacia el fin de la discriminación la pendiente descendió a la tasa de 
unas cuatro respuestas por hora. El día de la inversión se produjo un 
aumento de siete respuestas (once sobre el número esperado), pero el 
segundo día la tasa había disminuido aproximadamente a la que hubie- 
se existido con la ausencia de la inversión. Así, pues, el único cambio 
significativo (si es que puede considerarse como significativo) consiste 
en un ligero incremento de tasa, aparentemente distribuido uniforme- 
mente a lo largo de la hora. 


Asimismo, no hay ningún cambio de latencia comparable al obser- 
vado en la primera inversión. Esto es verificable en la figura 70, en que 
vienen dadas las latencias correspondientes a los dos días siguientes 
a la segunda inversión. (Hay la omisión aparente de un día al fin de 
la segunda serie porque la gráfica se ha espaciado para dar cabida a 
un segundo conjunto de datos que describiremos más tarde. Las tres 
series se tomaron continuamente.) Ya veremos que la subida de la la- 
tencia en la primera inversión no tiene contrapartida alguna en la 
segunda. 


Al cambiar las condiciones por tercera vez (volviendo ahora al con- 
junto invertido) no obtenemos de nuevo ningún efecto, como muestra 
la figura 69 después de la cuarta línea. vertical. En la figura 72 (pág. 233) 
reproducimos dos pares de registros y sus posiciones son indicadas en 
la figura 69, como antes. El número de respuestas correspondiente al día 
de la tercera inversión fue de 76, lo cual sigue perfectamente la pauta de 
las series descendientes dadas anteriormente. La latencia no experimenta 
tampoco ningún incremento significativo, aunque esto no aparece en la 
figura. 


Al final del experimento se efectuó una comprobación para evitar 
la posibilidad de un descenso de tasa por alguna razón desconocida vol- 
viendo al recondicionamiento periódico simple. El restablecimiento de 
una tasa constante aparece en el último día de la figura 69. Está claro 
que se desarrolla rápidamente una fuerza considerablemente elevada. 
No obstante, la pendiente media no es igual a la originalmente obser- 
vada, y en general es cierto que, tras una discriminación prolongada, la 
aceleración hacia la pendiente normal bajo recondicionamiento perió- 
dico queda retrasada. Ya he llamado la atención sobre ejemplos de esto 
en los registros C y D de la figura 69, aunque el efecto aquí podría 
deberse a la inversión. En la figura 73 damos otros cuatro casos, obte- 
nidos tras una larga serie de discriminaciones que describiremos en bre- 
ve. La curva típica (K) del retorno a la pendiente periódica tras una 
breve discriminación, incluida en las mismas coordinadas, procede de 
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la figura 58. Las líneas discontinuas del principio dan las pendientes 
alcanzadas al fin de la discriminación. Las del final dan las pendien- 
tes originales bajo recondicionamiento periódico. Podemos ver que sólo 
una de las cuatro ratas alcanza su pendiente original el primer día. Las 
otras muestran aceleraciones bastante suaves, pero muy retardadas, y 
al menos una de ellas no ha alcanzado la pendiente requerida hacia el 
final del sexto día, 
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TIEMPO (UNA HORA) 


FiGURA 792% 


TERCERA INVERSIÓN DE UNA DISCRIMINACIÓN 


La diferencia existente entre los efectos de una primera, segunda o 
tercera discriminación demuestra un nuevo hecho sobre la inducción. 
Puede darse una explicación parcial de la diferencia en términos de 
resultados anteriores. En lo que se refiere al primer sector de la curva 
(figura 68, registros A2 y B2), se ha mostrado que la extinción después 
de la discriminación puede dar una curva más pequeña que la extinción 
original, y no es descabellado suponer que una segunda curva no pro- 
mediaría más de siete respuestas en una hora y que una tercera sería 
insignificante. La ausencia de un Sector positivamente acelerador en 
la segunda inversión es el resultado más importante. Podría parecer 
atribuible a la retardación de la figura 73 y al supuesto de que, si la 
aceleración puede detenerse hasta que la nueva inducción pierda fuerza, 
no ocurrirá; pero ya que una cierta cantidad de extinción es presumi- 
blemente necesaria para el cese de la inducción, esta explicación no 
tiene validez. El simple hecho es que no ocurre ninguna inducción en 
la segunda inversión. 

Es un error identificar la inducción con la tasa de respuesta o el 
cese de la inducción con la disminución de la tasa observada durante 
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una discriminación. La separación de las fuerzas de los dos reflejos po- 
dría realizarse permaneciendo inalterada la inducción. Pero el grado 
de inducción varía. Para el valor de SP, aquí usado, es prácticamente 
completa durante el reforzamiento continuo, pero persiste solamente 
en cierta medida después de empezar el reforzamiento diferencial. La 
inducción superviviente desaparece rápidamente, y no hay razón para 
creer que es efectiva en ningún grado apreciable durante los últimos 
estadios de la extinción de sS% . R (en lo que toca a la fuerza original 
de la que era responsable). En el experimento presente el incremento de 
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FicuURA 7315 


RETORNO AL REFORZAMIENTO PERIÓDICO DESPUÉS DE TRES INVERSIONES 
DE UNA DISCRIMINACIÓN 


La aceleración, con una sola excepción, es mucho más lenta que después de una 
sola discriminación breve. La curva de K está tomada de la figura 58 


tasa en la primera inversión tiene que ser debido (exceptuando la curva 
de extinción inicial) a la inducción concurrente. El aumento es idéntico 
al de las figuras 62 y 65. En la segunda inversión y siguientes no se 
observa un incremento semejante. Esos hechos referentes a la inducción 
revelados por el experimento pueden formularse de la manera siguien- 
te: 1) La caída de la inducción de Sl a SA (tal como se efectúa en la 
discriminación original), no afecta a la inducción recíproca de SA a Sl, 
que debe eliminarse separadamente, y 2) la eliminación separada de la 
inducción de SA a SÍ no restaura la inducción de Sl a SA, 

Pero el hecho de que la desaparición de la inducción no es irrever- 
sible no explica totalmente nuestras presentes observaciones. Una se- 
gunda inversión debiera dar aún: a) la extinción del miembro previa- 
mente reforzado (observada como una pequeña curva de extinción el 
día de la inversión), y b) el recondicionamiento del miembro previa- 
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mente no reforzado (observado como un acortamiento de su latencia 
inicialmente larga). La necesidad de una pequeña curva de extinción 
es satisfecha, aproximadamente, por siete respuestas suplementarias en 
la segunda inversión, pero no en inversiones posteriores, y el requeri- 
miento de una larga latencia inicial con reducción subsiguiente no es 
satisfecho en ninguna inversión después de la primera. Así, en la figu- 
ra 70 una segunda inversión no va acompañada de ningún incremento 
de latencia significativo. Esto es cierto no sólo del promedio durante 
la hora, sino de los escasos reforzamientos. En otra serie de experimen- 
tos (que describiremos en breve), se efectuó una inversión en el curso 
de la hora con objeto de mostrar la simplicidad de este cambio. En la 
figura 74 reproducimos cuatro registros típicos que muestran tres días 
sucesivos para cada rata. El registro superior de cada grupo muestra 
el último día de una discriminación en que se refuerzan las respuestas 
en ausencia de la luz, el registro medio muestra el primer día de una 
(tercera) inversión y el registro inferior muestra una continuación de 
la discriminación invertida hasta la mitad de la hora, en que se alte- 
raron las condiciones otra vez. Este día la luz se encendió, como de cos- 
tumbre, antes de la respuesta reforzada en la línea vertical. Entonces 
se dejó encendida para el intervalo siguiente. Cuando se apagó de nue- 
vo, siguió inmediatamente una respuesta, tras lo cual se encendió otra 
vez. Durante el resto de la hora sSPA . R se reforzó periódicamente. Los 
registros no muestran ningún cambio significativo correlacionado con 
esta inversión. Las latencias medias de las ocho ratas para los once re- 
forzamientos de la hora (omitiendo en reforzamiento de la puesta en 
libertad) son los siguientes: 


6.0, 3.4, 5.3, 5.6, 3.0 || 6.4, 4.4, 5.7, 7.0, 54, 5.0. 


La latencia de 6.4 para la primera respuesta discriminatoria después de 
la inversión, no puede considerarse como significativamente por encima 
de la media de todos los casos (5.2). 

Con las mismas ocho ratas, un día posterior, se llevó a cabo un ex- 
perimento mucho más crucial sobre este punto. Se cambiaron las con- 
diciones de la discriminación en cada intervalo durante la hora. En el 
momento de poner en libertad a la rata, la luz estaba encendida y la 
primera respuesta fue reforzada; la luz se dejó encendida durante cinco 
minutos, transcurridos los cuales se apagó. Inmediatamente se produjo 
una respuesta. Se dejó la luz apagada durante cinco minutos, cuando 
se emitió una respuesta se encendió de nuevo, y así sucesivamente. En 
un grupo de cuatro ratas, la latencia media para una hora de este pro- 
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cedimiento fue de 5.1 segundos comparada con 5.0 segundos para el 
día anterior bajo el procedimiento de costumbre. En el otro grupo la 
latencia fue de 7 segundos comparada con los cinco segundos del día 
anterior. En el segundo caso, el aumento fue debido a cinco latencias 
especialmente largas (de un promedio de unos 25 segundos cada una) 
que aparecieron de forma anómala en los registros de dos de las ratas. 
Aunque probablemente son significativas, no afectan seriamente la con- 
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FicuRA 74% 
INVERSIÓN DE UNA DISCRIMINACIÓN EN EL CURSO DE UN PERÍODO EXPERIMENTAL 
En la señal vertical de cada conjunto se intercambiaron las propiedades de SD y SA 


clusión de que no se observa un aumento de latencia como el que sería 
requerido por una teoría de un rápido recondicionamiento en cada nue- 
va discriminación. Asimismo las pendientes de los ocho registros no 
muestran ningún efecto de extinción, como también sería requerido; los 
promedios correspondientes a los dos días anteriores al día de la in- 
versión repetida fueron de 135 y 116 respuestas, respectivamente. El día 
de la inversión el promedio fue de 110 respuestas. (Estos valores rela- 
tivamente altos son debidos al último estadio del experimento. Como 
ya he señalado, las pendientes hacia las que tienden las curvas de dis- 
criminación posteriores se incrementan progresivamente.) 


236 


Esta propiedad adicional de la conducta después de una segunda 
inversión puede explicarse diciendo que la base efectiva de la respuesta 
discriminatoria se ha convertido en el cambio de un estímulo al otro. 
El hecho observado es que tanto SA—>1 como SI—>A son estímulos 
discriminatorios efectivos, mientras que SI y SA son ineficaces. Ésta es 
la condición bajo la cual un cambio es la base efectiva de una discri- 
minación. Pero aún nos restan dos preguntas que responder: 1) ¿por 
qué la condición ya se halla establecida en la segunda inversión?; 
2) ¿por qué no hay una influencia inductiva de sSA—>1.R sobre 
sSI.R ni de sSI—>A.R sobre sSA.R o, en otras palabras, por qué 
las discriminaciones entre SA-=>1 y Sl y entre SI=>A y SA ya se ha- 
llan establecidas antes de que se hayan establecido discriminaciones 
en ambos sentidos entre Sl y SA? 


El primer punto no es difícil. En la discriminación original la res- 
puesta reforzada se hace realmente a SA—>1 (si es que ahora queremos 
hacer cabalmente esta distinción). La extinción, por otra parte, es de 
las respuestas a SA y no a SI —> A, ya que la rata está comiendo durante 
quince o veinte segundos antes de que se produzca el cambio a SA. 
Después de la primera inversión SI! —>A.R se refuerza periódicamente 
y sSI.R y no sSA—>l se extingue. La segunda inversión, por tanto, 
halla sSA>l.R y sSI—>A.R previamente reforzados y no subsi- 
guientemente extinguidos, y sSA.R y sSI.R extinguidos y no sub- 
siguientemente reforzados, lo cual constituye la condición requerida. 


El segundo punto, la falta de inducción, aparentemente no se ex- 
plica en base a cualquier principio previamente establecido. Lo dejaré 
en forma de una formulación descriptiva como uno de los resultados 
del experimento: con la presente técnica, en que se produce un refor- 
zamiento poco después de la presentación del estímulo, es posible obte- 
ner una discriminación basada totalmente en el cambio (tal como se 
define aquí) agotando las posibles discriminaciones existentes entre los 
mismos estímulos. 


(En el caso en que Sl es un chasquido, queda demostrado que un 
estímulo puede depender de la proximidad temporal de otro estímulo 
para su efectividad. No hay ninguna diferencia significativa, como es- 
tímulo discriminativo, entre una luz que permanece encendida durante 
el reforzamiento y un sonido que se presenta antes del reforzamiento, 
pero nunca simultáneamente con él. Si representamos gráficamente al 
sonido como SA—>1=> A, aparecerá su relación con el presente “cam- 
bio”. En el caso del cambio se requiere una formulación diferente a 
causa de otras posibles bases de la discriminación.) 
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En otra serie de experimentos se realizó el intento de separar los 
factores de las curvas del día de la inversión interpolando un día de 
recondicionamiento periódico. Se habían promediado los registros de 
un grupo de ocho ratas (de 90 días de edad al principio del experi- 
mento) para dar la curva inferior de la figura 75, en la que también 
reproducimos la curva media de las ocho ratas del experimento pre- 
cedente. Para facilitar la comparación hemos omitido de la curve: 


RESPUESTAS 


DÍAS 


FicurRA 751 


CURVAS MEDIAS CORRESPONDIENTES A DOS EXPERIMENTOS SOBRE LA INVERSIÓN 
DE UNA DISCRIMINACIÓN 


principal los días interpolados de recondicionamiento periódico y los 
hemos insertado debajo de los últimos días de las discriminaciones pre- 
cedentes. Las líneas discontinuas sólo dan las pendientes medias, pues 
no se ha hecho ningún intento de mostrar la aceleración inicial positi- 
va. La curva puede describirse con detalle de la manera siguiente: El 
primer día muestra la pendiente media del último de los cuatro días 
de recondicionamiento periódico (de sSA.R) a intervalos de cinco mi- 
nutos. La pendiente es algo menor que la del otro grupo. Los seis días 
siguientes de la figura muestran el desarrollo de una discriminación 
entre s$P!. R y sS21 .R. Al séptimo día, Sl está presente continuamen- 
te y las respuestas a dicho estímulo se refuerzan periódicamente; la 
pendiente restablecida viene indicada con una línea discontinua en el 
sexto día de la figura. Los registros separados se parecen a la figu- 
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ra 35, acercándose la aceleración positiva a una línea recta.* La pen- 
diente total es algo menor que la observada antes de la discrimina- 
ción, pero eso se debe principalmente más al tiempo requerido para la 
aceleración que a la aceleración retardada advertida en la figura 73. 
La discriminación invertida empieza al día siguiente a partir de la 
nueva pendiente periódica, y está bien desarrollada al cabo de seis 
días. Sigue otro día de recondicionamiento periódico (sSA.R), y la 
pendiente resultante aparece con la línea discontinua del día duodé- 
cimo. En este momento se empieza a sentir la aceleración retardada. 

Este segundo día interpolado de recondicionamiento periódico fuer- 
za el recondicionamiento de sSA.R, que no podía ocurrir en el primer 
experimento debido a la falta de inducción. Por lo tanto, cuando la 
discriminación se invierte de nuevo, se observa una subida significa- 
tiva de la pendiente. El número medio de respuestas de los tres días 
anteriores al día del recondicionamiento periódico, el promedio para 
dicho día (entre paréntesis) y el promedio de los tres días de la nueva 


? 


discriminación, son los siguientes : 
85, 72, 62 || (192) || 99, 85, 80 


Las respuestas suplementarias después de la inversión se deben 
principalmente al recondicionamiento periódico de sSA.R en el día 
interpolado. Del rápido ajuste a una pendiente constante se desprende 
claramente que dichas respuestas no son complementadas por ninguna 
inducción concurrente considerable a partir de sSlI.R, aunque esta 
pendiente, como ya he señalado, es incrementada por la inversión. 

Las latencias medias de esta serie de experimentos vienen dadas 
como los círculos en negro de la figura 70. Se produce un aumento 
significativo en la primera inversión, como antes, pero en la segunda 
no tiene lugar ninguno. El aumento de la primera es mucho menor 
que en el experimento anterior, a causa del día de recondicionamiento 
periódico. 

Como medida de control, se invirtieron las condiciones por tercera 
vez sin volver a la pendiente periódica. El resultado aparece en la 
figura 75 en la cuarta línea vertical y confirma plenamente el descu- 


3. Todos los registros del recondicionamiento periódico, en particular el 
primer día, están sometidos a variaciones aleatorias que dependen de si la rata 
responde, o no, poco después de que se haya conectado el almacén. Si no lo hace 
(y esto no se halla bajo control) por supuesto es imposible un reforzamiento 
periódico ordenado. Sólo raras veces el curso general del registro queda oscurecido. 
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brimiento anterior. Al día siguiente se invirtieron las condiciones en 
el curso de la hora, como ya hemos descrito (figura 74). 

En la figura 75 se indica claramente un incremento gradual de las 
pendientes finales alcanzado en discriminaciones sucesivas. Este hecho 
reviste considerable importancia. La mejor prueba de la caída de toda 
inducción durante una discriminación original es que la tasa de res- 
puesta a S% se aproxima a cero y lo hace tan rápidamente como si 
sSP.R no se reforzara periódicamente. Si hubiera una inducción per- 
sistente a partir de este reforzamiento previo, la tasa se acercaría a un 
valor constante mayor que cero, el cual daría una razón de extinción 
que expresaría el número de respuestas de sS%.R inducidas por un 
solo reforzamiento de sSP.R. Hasta el experimento presente, en que 
hace su aparición después de la primera inversión, no se ha hallado 
ninguna prueba de dicha razón (y por consiguiente ninguna prueba 
de una inducción persistente) para el valor de SP aquí usado. Las curvas 
de la figura 75 muestran una tendencia muy escasa a alcanzar una 
asimptote horizontal. Por el contrario, parecen estabilizarse en pendien- 
tes considerablemente por encima de las de los extremos de las curvas 
originales. La output constante de respuestas a S% no puede deberse 
a ninguna reserva anterior y tiene que indicar inducción concurrente. 
Es necesario matizar la segunda regla de la inducción dada antes 
(p. 235) en la forma siguiente: la inversión de una discriminación pa- 
rece establecer una pequeña inducción permanente en ambos sentidos. 


La ausencia de estímulo como propiedad discriminativa 


En uno o dos de los otros experimentos descritos en este capítulo 
ya se señaló que S” consistía en la ausencia de estímulo. Ocasionalmen- 
te, se introdujeron casos de este tipo como medida de control para 
prevenir una posible diferencia entre el efecto de la correlación de 
S* con la presencia de un estímulo discriminativo y con su ausencia. 
La posibilidad proviene del hecho de que la rata es menos activa en 
presencia de luz, de lo cual se deduce que la tasa será más baja du- 
rante una discriminación en que S* es Sl y está presente la mayor parte 
del tiempo.* En los experimentos precedentes uno de los controles con- 


4. El efecto de la luz sobre la tasa no significa que la reserva se vea incre- 
mentada anormalmente por un output reducido. El efecto de la luz puede ser 
que modifique impulso, y, como mostraré más tarde, el input y el output de las 
respuestas bajo un impulso reducido se ve en gran parte equilibrado para mantener 
el estado de la reserva. 
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sistió en dividir a los animales entre los dos tipos. La mitad de los 
casos del experimento antes citado en realidad fueron del tipo contra- 
rio, por lo que en esos casos 1 debe leerse A y viceversa. En las figu- 
ras 68 y 74 los registros se efectuaron en la forma descrita. En la fi- 
gura 69 las dos curvas inferiores fueron de la forma descrita, pero las 
dos superiores del tipo contrario; la aparente correlación, que es en- 
gañosa, se debe a la pendiente periódica, que resultó ser mayor en 
el segundo caso. En las figuras 70 y 75 cada punto o curva representa 


RESPUESTAS 


DÍAS 


Ficura 76 15 


COMPARACIÓN DE CURVAS DE DISCRIMINACIÓN EN QUE LOS ESTÍMULOS DISCRIMINATIVOS 
(sD) CONSISTEN EN LA PRESENCIA Y EN La AUSENCIA DE UNA LUZ 


La presencia de la luz era SD en la curva A; por ello, la mayor parte de la curva 
se registró en la oscuridad 


un número igual de registros de cada tipo. Los casos de las figuras 71 y 
73 pueden hallarse en la figura 69. 

Entre los dos casos no se observa ninguna diferencia significativa 
que sea lo bastante grande como para invalidar las presentes conclu- 
siones. Los ocho casos de la curva inferior de la figura 75 son conve- 
nientes para la comparación porque cada caso incluye tres curvas de 
discriminación de igual duración (seis días). Distribuyendo esas 24 cur- 
vas en los dos tipos y promediando, obtenemos la figura 76. En la 
curva A la luz permaneció apagada durante el recondicionamiento 
periódico y durante la mayor parte de la discriminación. En la otra 
curva se hizo todo lo contrario. La diferencia de pendiente durante el 
recondicionamiento periódico (líneas punteadas) demuestra el efecto 
depresivo de la luz, aunque hasta cierto punto puede ser debido al 
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muestreo. El inicio de la discriminación muestra una diferencia corres- 
pondiente a esas pendientes, que se pierde rápidamente cuando la 
tasa desciende. Puede decirse que el efecto de la luz es aproximada- 
mente proporcional a la tasa de respuesta. Las partes mayores de las 
curvas son casi paralelas. No hay ninguna diferencia de latencia signi- 
ficativa. Cuando el cambio anterior al reforzamiento fue l—>A, la 


latencia media fue de 5.86; cuando sucedió lo contrario, la latencia 
fue de 5.39. 


Resumen de la relación de la inducción con la discriminación 


Trataré ahora de reunir los datos precedentes en cuanto se refieren 
a la cuestión de la inducción y su relación con la discriminación del 
estímulo en una operante. La discriminación se define como el pro- 
ceso de crear una diferencia de fuerza entre dos reflejos relacionados. 
El proceso no se produciría si no fuera por la inducción, pues la extin- 
ción de un reflejo independiente que se ha condicionado independiente- 
mente no constituye una discriminación. Los hechos hasta ahora acu- 
mulados son los siguientes : 

El repetido reforzamiento continuo de una operante en presencia de 
SD crea una reserva que afecta a la misma respuesta en presencia 
de S%, aunque la curva de extinción en presencia de S% no es tan 
grande como en presencia de SD, 

Para el gran valor de SP utilizado en esos experimentos, la extinción 
de sS2 . R puede tener lugar con poca interferencia del recondiciona- 
miento periódico concurrente de sSP,R, en que la discriminación se 
inicia con una reserva considerable. En aras de la uniformidad con los 
hechos que siguen podemos suponer que tiene lugar cierta inducción 
después de que haya empezado el proceso de la discriminación, pero 
que la extensa curva de extinción la oscurece. Cuando la reserva inicial 
de $82 . R no es tan grande, el efecto de la inducción del condiciona- 
miento concurrente de sSP.R es obvio. La inducción declina aparente- 
mente muy pronto en el proceso de discriminación. 

Cuando ninguno de los dos reflejos se ha condicionado previamen- 
te, puede que no haya interferencia en absoluto. En el caso óptimo, la 
rata puede hacer la distinción requerida desde el principio, práctica- 
mente sin inducción entre los procesos y, por consiguiente, sin necesidad 
de extinción. A partir de esta posición media óptima el resultado puede 
divergir en dos direcciones: 1) hacia un condicionamiento inductivo, 
en que se construye ligeramente la fuerza de sS% . R y debe extin- 
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guirse; y 2) hacia una extinción inductiva, en que ambos reflejos de- 
saparecen finalmente pese al reforzamiento de sSD.R. 

La caída de la inducción de SP a S% no afecta a la inducción recí- 
proca de S2 a SD, 

La caída separada de la inducción de S* a SD no restaura la induc- 
ción de SP a $2, pero se crea una pequeña inducción permanente que 
opera en ambas direcciones. 

En nigún caso se ha obtenido evidencia de que la rata llegue a 
distinguir entre dos estímulos con respecto a los cuales su conducta 
ya no difería antes de la correlación diferencial con un estímulo refor- 
zante. Esto puede deberse al hecho de que he empleado un valor de 
SD lo bastante grande como para permitir la detección de una diferen- 
cia original entre el condicionamiento directo y el inductivo. Con las 
pruebas que tenemos a mano no nos es posible determinar si las mis- 
mas leyes se cumplen en lo que respecta a estímulos menos diferencia- 
les. Pero puedo señalar que la imposibilidad de detectar una diferencia 
de conducta anterior a la discriminación no constituye ningún argu- 
mento en contra de la presente interpretación del proceso esencialmen- 
te como una acumulación de pequeñas diferencias, al menos hasta que 
las técnicas sean lo bastante rigurosas como para hacer de dicha im- 
posibilidad una indicación razonable de la ausencia de tales diferencias. 


Podemos formular una expresión formal del proceso de discrimi- 
nación de la manera siguiente: 

LEY DE LA DISCRIMINACIÓN DEL ESTÍMULO EN EL TIPO R. La fuerza 
adquirida por una operante a través del reforzamiento no es indepen- 
diente de los estímulos que afectan al organismo en aquel momento, 
y pueden darse fuerzas ampliamente diferentes a dos operantes que 
tengan la misma forma de respuesta mediante su reforzamiento dife- 
rencial con respecto a tales estímulos. 


La discriminación y la reserva del reflejo 


La discusión precedente se ha enfocado sólo en términos de la 
fuerza del reflejo, por lo que sería conveniente hacer una recapitula- 
ción de sus puntos más importantes en términos de la reserva del reflejo. 

Al condicionar una operante creamos una reserva que tiene las 
dimensiones de una serie de respuestas a emitir llegado el caso. La 
forma de la respuesta es independiente de la estimulación discrimi- 
nativa que puede resultar activa en el reforzamiento, y podemos dar 
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por supuesto que el número total de respuestas disponibles es, asimismo, 
independiente. Con respecto al campo estimulante observamos que las 
respuestas ocurren más fácilmente en presencia de los estímulos exac- 
tos que se hallaban presentes en el reforzamiento. El campo discri- 
minativo en el momento de la emisión actúa como una especie de filtro 
pautado: si se iguala al campo existente en el momento del reforza- 
miento, la tasa de respuesta es máxima; en caso contrario, la tasa dis- 
minuye. La figura 53 sugiere que incluso con un filtro inferior al 
óptimo todas las respuestas de la reserva se emitirían si el tiempo lo 
permitiera, aun cuando un cierto número de ellas tienda a quedarse en 
la reserva. Las respuestas remanentes pueden evocarse rápidamente 
pasando al campo óptimo, como en las flechas de la figura 58. 

En una discriminación, considerada como un mero ensanchamiento 
de la diferencia de fuerza de dos campos, construimos la parte con- 
tenida de la reserva que está bajo el control de SP al tiempo que per- 
mitimos que las respuestas disponibles bajo $4 se disipen. La figura 60, 
pues, se halla estrechamente relacionada con la figura 53. La caída de 
la inducción antes descrita no es esencial a este proceso, pero contribuye 
al mismo agudizando la acción filtrante del campo estimulante. Las 
formulaciones siguientes pueden aclarar esta cuestión: 

Condicionamiento inductivo. Las respuestas acumuladas bajo SD es- 
tán disponibles bajo S%. 

Extinción inductiva. Se sustraen las respuestas emitidas bajo 8% au- 
la reserva disponible bajo SP. 

Discriminación. El reforzamiento bajo SP y la extinción bajo S* au- 
mentan el número de respuestas disponibles principalmente bajo SP. 

Caída de la inducción. Las respuestas adquiridas bajo S” pueden 
hacerse menos fácilmente disponibles bajo S”. 

Por supuesto, la noción de filtro no es más que un recurso conve- 
niente para representar la dependencia observada en la tasa de los 
estímulos discriminativos externos. A pesar de las diferencias de tasa 
bajo campos externos diferentes, sólo queda implicada una reserva en 
tanto la forma de la respuesta siga siendo la misma. Esto es suficien- 
temente importante como para formularlo en forma de ley. 

Ley DE La RESERVA OPERANTE. El reforzamiento de una operante 
crea una sola reserva, cuyo tamaño es independiente del campo estimu- 
lante, pero que es diferencialmente accesible bajo campos diferentes. 


La falta de un estímulo provocador en la conducta operante, unida 
a la ley de la reserva operante, da un peso considerable a la respuesta 
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propiamente dicha, y esto parece debilitar todo intento de agrupar las 
operantes bajo la denominación general de reflejos. Está bien tener en 
cuenta un posible evento originante (cf. la pequeña r de nuestros pa- 
radigmas) y dar cabida a otras formas en que una respuesta puede 
estar relacionada con un estímulo. Sin embargo, hay que comprender 
que la reserva operante es una reserva de respuestas y no de unidades 
estímulo-respuesta. No está claro si podemos decir lo mismo de las 
respondientes. Si hubiera una ley similar de la reserva respondiente, 
según la forma de la respuesta, ello explicaría gran parte de la elevada 
inducción entre reflejos homogéneos citada por Pavlov y, asimismo, per- 
mitiría explicar de otra forma fenómenos tales como la “transferencia de 
la inhibición” de un “reflejo” a otro. 


La formulación y el enfoque experimental general que he descrito 
aquí no son tradicionales, pero sus idiosincrasias nacen más de una 
diferencia de propósito que de un desacuerdo real con la investigación 
tradicional. La mayor parte de los experimentos sobre discriminación 
se refieren a la evaluación de las diferencias mínimas entre estímulos 
discriminables por el organismo. Se dirigen hacia la medición de una 
especie de capacidad, y el proceso de discriminación entra en el expe- 
rimento sólo como parte de este método. No se profundiza en el pro- 
ceso más que lo necesario para obtener una indicación conveniente de 
la existencia de una conducta diferencial. En mi exposición no me 
he interesado por la capacidad del organismo para formar una discri- 
minación. Los estímulos muestran diferencias relativamente grandes, y 
mi principal objeto ha sido más bien seguir el curso del desarrollo de 
una discriminación y determinar, de la forma más rigurosa posible, las 
propiedades del proceso. 

Creo que el presente análisis indica una cierta falta de adecuación 
de los métodos tradicionales en lo que se refiere a la dinámica del 
proceso de discriminación. Como ejemplo típico consideramos el caso 
en que una rata debe torcer hacia la derecha en una intersección, cuan- 
do un tono tiene una agudeza determinada, y hacia la izquierda cuando 
tiene otra. De acuerdo con el análisis anterior, hay que tomar en cuenta 
cuatro reflejos: 


1) sSD: Tono A. R: vuelta a la derecha 
2) sSD: Tono A. R: vuelta a la izquierda 
3) sSD: Tono B. R: vuelta a la derecha 
4) sSD: Tono B. R: vuelta a la izquierda 
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El experimento se proyecta de forma tal que 1) y 4) sean reforza- 
dos mientras que 2) y 3) no lo sean. Las fuerzas cambian de tal modo 
que en presencia del tono A la rata dobla hacia la derecha y en pre- 
sencia del tono B hacia la izquierda. Si los tonos no se hallan muy 
separados (de acuerdo con la capacidad discriminativa del organismo), 
el “problema se resuelve” lentamente. La inducción de 4) sobre 2) y 
de 1) sobre 3) (e inducción inversa), mantiene las fuerzas aproximada- 
mente en sus valores relativos originales. 

La dificultad que plantea el método es que los cambios de fuerza 
no pueden seguirse fácilmente. Las frecuencias del reforzamiento y 
de la extinción dependen de la conducta del organismo y, por tanto, 
no se hallan bajo un control conveniente. A medida que progresa el 
experimento, el organismo tiende a hacer “elecciones” cada vez más 
correctas, pues las fuerzas de los dos reflejos se van separando, pero 
no existe ninguna medida directa de la fuerza. El dato es meramente 
la “elección” final, y el curso del cambio de fuerza no viene indicado 
por el aumento del número de elecciones correctas. Generalmente se 
necesita alguna medida arbitraria para obtener una curva de “aprendi- 
zaje”, como, por ejemplo, el número de elecciones correctas en grupos 
de veinte intentos. La forma de la curva depende del valor de veinte. 
Para el propósito de establecer una fuerte discriminación de manera 
que un reflejo sea prepotente sobre el otro prácticamente en todas las 
Ocasiones, bastará una caja de discriminación; pero para cualquier 
estudio de la naturaleza del proceso este instrumento se revela como 
relativamente tosco. 
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6. Algunas funciones 
de los estímulos 


Un estímulo discriminativo como «inhibidor» 


La discriminación de un estímulo constituye otro caso al que fre- 
cuentemente se extiende la noción de “inhibición”. Si se establece una 
discriminación entre dos estímulos compuestos que difieren con respecto 
a su pertenencia, de tal modo que el reflejo S4 . R sea siempre reforzado 
mientras que S453. R no lo sea, S3 adquiere un poder aparente que su- 
prime la acción de S4.R. El efecto de 53 es llamado por Pavlov inhibi- 
ción condicionada o diferencial. El caso se parece más a la verdadera 
inhibición que a la simple extinción, porque implica un segundo estímu- 
lo; pero de acuerdo con la presente interpretación una discriminación 
no es más que una forma modificada de la extinción y no se precisa de 
ningún concepto de inhibición para explicarla. SB no actúa para inhibir 
el reflejo S*. R de una forma comparable, por ejemplo, a la inhibición 
de comer o de salivar debida a un sonido alto. Es la propiedad diferen- 
ciadora de un estímulo compuesto. 

La prueba aportada por Pavlov de que la acción de S3 al reducir la 
magnitud de R en respuesta a S* es realmente inhibidora, y “no consti- 
tuye simplemente una desaparición pasiva de un reflejo condicionado 
positivo debida al estímulo compuesto que habitualmente no está re- 
forzado”, se basa primariamente en la transferencia del poder “inhibidor” 
de un complejo de estímulos a otro. Un estímulo táctil, por ejemplo, que 
se ha vuelto “inhibidor” al combinarse con el estímulo de un objeto en 
movimiento giratorio, resulta que también “inhibe” una respuesta a 
una lámpara que despide destellos, en presencia de la cual nunca ha 
dejado de ser reforzada. Pero toda la evidencia de este tipo se ve debi- 
litada por el hecho de que los diferentes reflejos condicionados tipo S 
basados en el mismo estímulo reforzante no son entidades independien- 
tes. El importante problema de su interrelación inductiva no ha sido 
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resuelto. Puede ser relacionado con la necesidad de cierta cantidad 
de discriminación en el condicionamiento de este tipo y con la comu- 
nidad de reserva de los reflejos discriminativos que tienen la misma 
forma de respuesta. Por el momento, la debilidad de la evidencia de la 
transferencia de un reflejo a otro, dentro de dicho grupo, puede indicar- 
se simplemente citando la demostración de Pavlov de que la simple 
extinción del reflejo S : metrónomo. R : salivación, produjo la completa 
extinción de S: estímulo táctil. R:salivación y una debilitación de 
S :zumbador. R : salivación. Esto aparentemente establece la continui- 
dad inductiva de esos estímulos más bien diversos, que explicaría la 
aparente transferencia de poder inhibidor en los casos citados por 
Pavlov. La necesaria extinción de S4S3, R puede afectar a otro reflejo 
SC. R directamente y explicar el efecto aparente de S3 cuando se le pre- 
senta S“. Los ejemplos de Pavlov, a partir de reflejos heterogéneos, no 
escapan a esta crítica porque el mismo efector sigue estando implicado. 

Quizás la forma más simple de demostrar la ilegitimidad de la asig- 
nación de poderes inhibidores a S3 es invertir las condiciones de la 
discriminación de modo tal que S4+.R se extinga y que S483.R quede 
reforzado. La actividad de S4S3.R se ve entonces reducida cuando se 
elimina SB. Para ser congruentes debemos decir que la ausencia de SB 
ha adquirido poder inhibidor, pero es difícil ver hasta qué punto puede 
introducirse la ausencia de un estímulo en una nueva situación experi- 
mental para mostrar la transferencia. Pueden generarse otros casos 
absurdos o que inducen a confusión basando la discriminación sobre 
el valor de una sola propiedad. Por ejemplo, tendríamos que mostrar 
que la respuesta a una luz puede inhibirse cambiando el tono o el olor 
de la luz para demostrar la transferencia de experimentos en los que 
tales cambios han adquirido poder inhibitorio mediante la discrimina- 
ción. Es sólo cuando el componente diferenciado tiene la condición 
de un estímulo que se le asigna el poder inhibidor. Cuando se trata de 
una propiedad singular o de un cambio de propiedad, la analogía con 
la verdadera inhibición es menos evidente. 

Es posible que el miembro de un estímulo compuesto correlaciona- 
do con un no-reforzamiento pueda adquirir un verdadero poder inhibi- 
dor condicionado completamente aparte del proceso de la discrimina- 
ción. La interrupción del reforzamiento de una respuesta es una de las 
operaciones que deprimen la fuerza del reflejo a través de un cambio 
emocional, y la distinción que puede establecerse entre inhibición y un 
tipo de emoción es escasa o nula. En la extinción simple el efecto de 
la interrupción del reforzamiento produce la fluctuación cíclica que ca- 
racteriza al proceso. En una discriminación, la presencia de SB en cada 
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ocasión en que el reflejo no es reforzado puede conferirle un poder 
emocional condicionado, que puede transferirse a otra situación si S3 
es, asimismo, transferible, Pero entonces S3 deprime la fuerza de un 
nuevo reflejo, no porque haya adquirido poder inhibidor por haber sido 
la propiedad correlacionada con un no-reforzamiento, sino porque ha 
sido correlacionada previamente con una operación emocional necesa- 
riamente ligada con el no-reforzamiento. La imposibilidad de reforzar 
tiene dos efectos: un cambio de fuerza del reflejo mediante condicio- 
namiento, y un estado emocional. En la “inhibición condicionada” la 
transferencia sería debida al primero, pero una indicación de transfe- 
rencia, en realidad, puede basarse en el segundo. 

El uso del concepto de inhibición para explicar el efecto del estímulo 
discriminativo no correlacionado con el reforzamiento es debido, en patr- 
te, a la estrechez de la concepción tradicional del estímulo. El término 
tiene la desafortunada connotación de un acicate para la acción. En 
su uso tradicional se refiere a una fuerza que impulsa al organismo, un 
significado que ha convenido a los escritores que desean probar que la 
ocurrencia de un elemento de conducta bajo un conjunto determinado 
de circunstancias externas es inexorable. Por extensión, la misma función 
activa del estímulo se ha aplicado a la inactividad a través de la noción 
de inhibición como fuerza Supresora. Aunque el presente sistema pre- 
supone la legalidad de la conducta y reconoce el papel del ambiente, 
no recurre necesariamente al ambiente como fuerza impulsora. La fun- 
ción de un estímulo al establecer una discriminación, por ejemplo, no 
tiene nada del carácter de un acicate. La distinción entre un estímulo 
discriminativo y un estímulo provocador ya ha sido mencionada varias 
veces y ahora puede ser elaborada. Será conveniente, al mismo tiempo, 
pasar revista a las otras maneras en que la acción del ambiente puede en- 
trar en una descripción de la conducta. 


Los diversos tipos de estímulos 


A: EL ESTÍMULO PROVOCADOR 


Se definió al estímulo provocador en el capítulo 1 como “una 
parte del ambiente o una modificación de una parte del mismo” corre- 
lacionada con la ocurrencia de una respuesta. La noción de provocación 


1. Cf. a ese respecto la identificación práctica de “estímulo” e “impulso” 
por parte de Holt (45). 
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se limita aquí a la de correlación. El término describe el hecho de que 
la presentación de un estímulo es seguida por una respuesta, y no es 
necesario asignar ningún carácter transitivo al papel del estímulo. La no- 
ción de provocación es aplicable sólo a la conducta respondiente y, creo 
yo, se comprende de forma lo bastante clara como para no precisar 
aquí de mayor elaboración. Por parte del ambiente se entiende una 
parte de las energías o substancias que afectan directamente al orga- 
nismo. Es elíptico, pero a menudo conveniente, hablar de sus fuentes, 
como, por ejemplo, cuando se llama a una campanilla un estímulo audi- 
tivo o a un libro un estímulo visual. La práctica es peligrosa, ya que la 
estimulación que parte de dicha fuente es altamente variable, pero a 
menudo tiene éxito a causa de la naturaleza genérica de los estímulos. 
En el caso de un estímulo propioceptivo es necesario recurrir a la acti- 
vidad del organismo responsable de la estimulación, y se implica que 
un movimiento dado (verbigracia, la flexión de un miembro) siempre 
produce la misma estimulación dentro de límites genéricos. 

La ligera ambigiiedad en la expresión “una parte del ambiente o 
una modificación de una parte del mismo” precisa despejarse. El fe- 
nómeno de adaptación en los órganos terminales, las fibras nerviosas 
y la tasa crítica resultante de presentación de un estímulo, han conduci- 
do a la concepción del estímulo como “cambio en el ambiente de un 
tejido excitable” (24). Pero cuando la adaptación o la fatiga se produce 
lentamente, un prolongado período de respuesta puede prevalecer, du- 
rante el cual es difícil ver que algo está cambiando. La modificación 
postural debida a la posición de los laberintos en el espacio o a la extir- 
pación de un laberinto presenta una respuesta sostenida correlacionada 
con el estímulo, sostenido e inalterado, suministrado por el campo gra- 
vitatorio. Lo que se quiere dar a entender por la correlación de estímulo 
y respuesta es que cuando el estímulo está presente la respuesta 
se halla asimismo presente (o se producirá en breve). Por lo general, es 
preciso presentar el estímulo para demostrar la correlación, y la pre- 
sentación, por supuesto, constituye un cambio en el campo estimulante, 
pero la respuesta está correlacionada con la presencia y no con la pre- 
sentación, 

Así, pues, en este sentido un estímulo es un agente continuo, pero 
un cambio puede también actuar como un estímulo provocador en cier- 
tos reflejos, y la definición debe tener en cuenta esta posibilidad. Como 
agente continuo, un estímulo debe poseer un cierto número mínimo de 
propiedades como son: localización, intensidad, cualidad, duración y 
tal vez otras. Como cambio, puede afectar solamente a una propiedad 
y puede también consistir simplemente en la retirada de una fuerza 


250 


estimulante. Un perro puede enderezar sus orejas si se le presenta un 
tono como agente continuo, pero la respuesta puede provocarse, asimis- 
mo, por un cambio de tono o intensidad de un sonido continuo o por su 
cese. El número de reflejos incondicionados en respuesta a cambios de 
propiedades singulares es probablemente escaso, pero tales cambios 
pueden obtenerse fácilmente como estímulos condicionados tipo S. 


B: EL ESTÍMULO DISCRIMINATIVO Y EL PSEUDORREFLEJO 


Un pseudorreflejo es una relación entre un estímulo y una respuesta, 
el cual superficialmente se asemeja a un reflejo, pero que implica a otros 
términos distintos de los expresados en la relación o bien depende de 
ellos. Aunque presenta una correlación topográfica similar entre es- 
tímulo y respuesta, difiere de un verdadero reflejo de muchas maneras, 
y si queremos evitar la confusión debemos mantener la distinción en el 
estudio de las leyes estáticas y dinámicas. El ejemplo más común con- 
siste en una discriminación del estímulo en el tipo R. Establezcamos 
una discriminación entre SA y Sl reforzando sólo las respuestas en pre- 
sencia del segundo. Cuando esto ya se ha efectuado, (sS!. R) es mayor 
que (sSA. R) y a cualquier valor del impulso subyacente tal que (sS!. R) 
generalmente ocurre pero (sSA , R) no, existe la condición siguiente: Dado 
un organismo que en presencia de SA ordinariamente no responde, la 
presentación de SÍ será seguida por una respuesta. Con vistas a hacer 
una comparación podemos seleccionar un ejemplo y representar un pa- 
radigma imitando el tipo S de la manera siguiente: 


9% luz A Ro: 
sS'; palanca y R!: presión 


La relación existente entre la luz y la respuesta a la palanca consti- 
tuye un pseudorreflejo. Tiene algunas de las características distintivas de 
un reflejo condicionado tipo S: la respuesta original a S” es irrelevante, 
la relación S”. R! puede estar ausente antes del “condicionamiento”, los 
cambios de fuerza tienen lugar en una dirección positiva solamente, y 
son posibles las mediciones de la latencia, del umbral y de la razón R/S. 
En todos esos aspectos difiere de un reflejo tipo R, aunque el ejemplo 
se base en la conducta operante. En otros aspectos difiere de ambos 
tipos. La respuesta requiere no sólo $” sino S*; la luz es sólo una parte 
del estímulo discriminativo en presencia del cual se emite la respues- 
ta. El estímulo S! no se retira cuando se comprueba la efectividad del 
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“estímulo condicionado”; por el contrario, se extingue sólo la respuesta 
a S', una característica que no tiene paralelismo en ninguno de los dos 
tipos. 

A pesar de estas diferencias se podría decir corrientemente que la 
luz se convierte en el “estímulo condicionado” de la respuesta a la pa- 
lanca, de la misma forma que se convierte en el estímulo de la saliva- 
ción, pongamos por caso. Esta confusión con el tipo S evidentemente 
surge del descuido del reflejo extinguido. Se ignora la relación de apre- 
tar la palanca con la misma palanca y sólo se toma en cuenta la rela- 
ción con la luz. La palanca llega a considerarse, no como una fuente de 
estimulación, sino como una parte del aparato, pertinente a la respuesta 
solamente por razones mecánicas. Cuando la discriminación se basa en 
una respuesta que no requiere otros estímulos discriminativos, la posi- 
bilidad de este descuido se incrementa enormemente. Si sustituimos la 
“presión de la palanca” por la “flexión de un miembro” y seguimos por 
el momento con el tipo R, no es menester ningún estímulo externo para 
la ejecución de la respuesta o para su reforzamiento. Habiendo estable- 
cido $. R como una operante condicionada de cierta fuerza, introduci- 
mos una estimulación discriminativa como antes, reforzamos sSI. R y 
extinguimos sSA.R. Entonces tenemos una condición en que un orga- 
nismo ordinariamente no responde, pero lo hace inmediatamente con 
una flexión a la presentación de Sl, 

Superficialmente este pseudorreflejo se parece al reflejo condiciona- 
do considerado por lo general como tipo S que se establece permitiendo 
que la presentación de Sl sea seguida de un shock en el pie hasta pro- 
vocar una flexión cuando se presenta solo. Tal vez no hay forma de 
determinar la diferencia partiendo sólo de la topografía de los aconte- 
cimientos correlacionados. Pero las propiedades estáticas y dinámicas 
del pseudorreflejo son completamente diferentes de las del verdadero 
reflejo, como mostraré dentro de poco. 

En un pseudorreflejo condicionado basado en el tipo S, la distinción 
es mucho menos clara. En este caso, somos capaces, invariablemente, 
de descuidar el miembro extinguido porque las respuestas disponibles 
no requieren estímulos discriminativos externos. Por ejemplo, dado el 
reflejo condicionado S: tono. R:salivación, podemos establecer una 
discriminación entre S y SSI (en que Sl es, por ejemplo, una luz) refor- 
zando sólo el segundo. Entonces el organismo, que ordinariamente no 
responde en presencia del tono, responderá a la presentación de la luz. 
(Ya veremos que esto es lo contrario del caso en que Sl está correlacio- 
nado con la ausencia de reforzamiento y en que se llama “inhibidor”.) 
La única diferencia existente entre la presente relación de la luz con 
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la respuesta y un verdadero reflejo tipo S, es la extinción de la respues- 
ta al tono, lo cual muestra que ha tenido lugar una discriminación. El 
reforzamiento de SSI.R debería condicionar las respuestas a ambos 
estímulos separadamente a través de la inducción, pero observamos que 
el organismo no responde en presencia del tono solo. Esta diferencia 
puede reducirse a voluntad disminuyendo la significación de S en el 
reflejo básico del pseudotipo. Si bajamos la intensidad del tono o esco- 
gemos un estímulo menos importante, podemos acercarnos cuanto que- 
ramos a un reflejo condicionado tipo S. En realidad, no podemos alcan- 
zar el tipo S de esta forma, pero podemos fácilmente alcanzar un punto 
en que el pseudorreflejo sea idéntico a cualquier ejemplo experimental 
de este tipo porque aparentemente, como ya he mostrado, en los casos 
de tipo S siempre se ve implicada cierta cantidad de discriminación. 

La posición del pseudorreflejo puede resumirse como sigue: Cuando 
un pseudorreflejo se basa en un reflejo tipo R y cuando otros estímulos 
discriminativos son necesarios para la provocación de la respuesta, hay 
importantes razones teóricas y prácticas que exigen una formulación 
separada. Cuando la respuesta no requiere “apoyo” externo, hay me- 
nores diferencias, pero se necesita una formulación separada con objeto 
de clarificar las diferencias de sus propiedades estáticas y dinámicas. 
Cuando el pseudorreflejo se basa en el tipo S, la distinción queda debili- 
tada, pero debería seguir haciéndose excepto cuando S queda reducido 
a un valor muy bajo relativo a Sl. Las propiedades estáticas y dinámicas 
entonces se acercan a las de un verdadero reflejo, aunque es dudoso 
si un reflejo condicionado tipo S aparece alguna vez experimentalmente 
sin verse perturbado por la necesaria extinción de la amplitud de su 
reforzamiento. En el caso límite, la distinción entre el pseudorreflejo y el 
reflejo verdadero de este tipo es imposible, no porque los casos sean 
idénticos, sino porque no se consigue que el tipo S aparezca experimen- 
talmente en forma pura. 

El lector puede objetar que al mantenerme al nivel de la correlación 
de un estímulo y una respuesta al definir un reflejo, no tengo derecho 
a llamar pseudorreflejo a la relación entre una luz y la respuesta a la 
palanca. Es cierto que en cualquier momento un pseudorreflejo puede 
tener las propiedades del tipo de correlación que se llama reflejo, pero 
con respecto a las propiedades estáticas o dinámicas, que entran en 
juego al definir un reflejo como unidad de conducta, los dos casos difie- 
ren ampliamente. Sin embargo, para conseguir una clasificación simple 
de esos fenómenos insisto sobre la distinción. En una operante discri- 
minada no hay relación alguna entre el estímulo discriminativo y la 
respuesta que cumpla las leyes estáticas del verdadero reflejo. La intro- 
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ducción de SP da de nuevo pleno sentido a los términos de latencia, 
umbral, postdescarga y razón R/S, pero las leyes que los describen di- 
fieren. 

Tal vez el ejemplo más importante es la razón R/S. En una operante 
discriminada, la magnitud de la respuesta es relativamente, si no total- 
mente independiente, de la magnitud de SP con'tal que SP se halle por 
encima del umbral. La intensidad de la operante es altamente estable, 
excepto cuando es deliberadamente diferenciada (ver capítulo 8). El 
vigor de la operante representativa descrita en este libro varía cien ve- 
ces en cuanto se mide por su tasa de ocurrencia. La fuerza real con que 
se ejecuta la respuesta puede que no difiera en absoluto o, a lo sumo, 
verse duplicada. La ausencia de relación entre la intensidad de la res- 
puesta y SP desde hace tiempo ha constituido una cuestión desconcer- 
tante en el estudio de la conducta operante, especialmente cuando se 
ha realizado el intento de aplicar conceptos derivados de los trabajos 
tradicionales sobre conducta respondiente. Un ejemplo muy simple pue- 
de ser la conducta de un niño al alcanzar un bloc. Como el estímulo 
emitido por el bloc es visual, su intensidad presumiblemente puede cam- 
biarse sólo variando la iluminación. Pero dentro de una gama bastante 
amplia, las propiedades intensivas de la conducta estarán relacionadas 
con esta variable de una forma débil o incluso inexistente. De la misma 
forma tampoco podemos medir los cambios dinámicos en términos de 
la relación de la intensidad de la respuesta con la del estímulo. La fuer- 
za con que el niño extiende el brazo es una medida muy imperfecta del 
grado de condicionamiento, por ejemplo, o del estado del impulso. La 
conducta es operante y debe estudiarse con su medida apropiada, a 
saber, la tasa de ocurrencia de la respuesta. La aparente razón R/S es, 
probablemente, inútil. 

Asimismo, los “umbrales” y “latencias” aparentes de un pseudorrefle- 
jo no obedecen a las leyes estáticas y dinámicas establecidas para las 
respondientes. El umbral debe definirse aquí como el valor más bajo 
del estímulo capaz de utilizarse en el establecimiento de una discrimi- 
nación. Los valores son, en general, inferiores que los de los verdaderos 
reflejos, y no varían linealmente con los cambios de fuerza. Las laten- 
cias, en general, son mucho más largas para los pseudorreflejos. Por ejem- 
plo, en el capítulo 5 se describió un valor medio de veinte segundos. Al 
igual que el umbral, la latencia de un pseudorreflejo no es una función 
simple de la fuerza. 

Se han llevado a cabo algunos experimentos exploratorios en un 
intento de establecer valores intermedios de la latencia discriminativa, 
bien reduciendo el impulso, bien reduciendo la reserva gracias a la ex- 
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tinción. No se ha descubierto ninguna graduación de la latencia com- 
parable a la de una respondiente simple. La latencia no se prolonga 
durante ninguno de los dos tipos de reducción de fuerza hasta que em- 
piezan a salir valores extremos que pueden apenas considerarse como 
latencias. A medida que se reduce el impulso, se alcanza un punto en 
que la rata no responde tras la presentación del estímulo discriminativo, 
pero en tanto sigue respondiendo, las latencias son del orden original, 
El caso de la extinción se comprueba presentando SP a intervalos regu- 
lares sin reforzamiento. Finalmente, no se emiten respuestas que pue- 
dan considerarse correlacionadas con la presentación del estímulo. Des- 
pués de la extinción, una sola presentación reforzada de SD sirve para 


LATANCIA 


SVL1SINASIY 


TIEMPO (LÍNEAS VERTICALES SEPARADAS DE CINCO MINUTOS) 


Ficura 77 


EXTINCIÓN DEL REFLEJO REFORZADO EN UNA DISCRIMINACIÓN QUE NO MUESTRA 
NINGÚN PROLONGAMIENTO PROGRESIVO DE LA “LATENCIA” 


Las alturas de las líneas verticales indican la latencia en cada presentación de SD 
(no reforzada). La tasa de respuesta declina suavemente, pero la latencia no mues- 
tra ningún cambio progresivo 


restaurar la latencia a su valor original. De la latencia no se obtienen 
curvas de extinción ni de recondicionamiento. 

La figura 77 muestra la extinción de una discriminación que se ha- 
bía establecido por completo. El día representado en la figura se pre- 
sentó el estímulo discriminativo (un zumbido) cada cinco minutos, pero 
no se reforzó ninguna respuesta, El procedimiento fue esencialmente 
el mismo de la figura 61 y las curvas evidentemente similares. En la 
figura 77, las latencias también se registran con líneas verticales, repre- 
sentando la altura de cada línea el tiempo que transcurre entre la pre- 
sentación de SP y la próxima respuesta. La curva dada por la frecuencia 
de la respuesta declina suavemente durante el período de dos horas, 
pero no se produce ningún prolongamiento progresivo de la latencia. Al 
final del período, para apresurar la extinción, se hicieron rápidamente 
tres presentaciones de SP. La última de ellas no consiguió evocar res- 
puesta alguna durante más de un minuto. Es dudoso si eso puede con- 
siderarse una latencia, pero en todo caso muestra el tipo abrupto de 
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cambio que se obtiene durante la extinción. Sin lugar a dudas falta 
una gradación de la latencia. 


El estímulo discriminativo tiene un status muy diferente del del 
estímulo provocador. Es menos probable que se considere como un aci- 
cate y quizás se describe mejor como la “presentación de la ocasión” 
para una respuesta. El hecho de si la respuesta ocurre o no, no depende 
del estímulo discriminativo, una vez presente, sino de otros factores. 
Esto se aplica particularmente a la conducta operante. No se expresa 
tan fácilmente en el caso de la conducta respondiente porque las res- 
pondientes condicionadas parecen siempre implicar una discriminación 
y, por lo tanto, son hasta cierto punto falsas. 

Estrictamente hablando, debiéramos referirnos a una operante dis- 
criminada como “ocurriendo en presencia de” SP en lugar de “provo- 
cada en respuesta a” SD, Sin embargo, la analogía con el verdadero re- 
flejo es casi demasiado grande como para no caer en la tentación de 
emplearla ocasionalmente, y la extensión de esos términos puede pro- 
vocar escasas dificultades, con tal que se asigne a los mismos un senti- 
do general intermedio con respecto a la mera correlación topográfica y 
temporal entre estímulo y respuesta. En los capítulos anteriores he tra- 
tado de ser específico siempre que había un peligro de confusión, pero 
en otras partes se usan ocasionalmente “provocación” y “respuesta 
a” en este sentido más amplio. 


Al distinguir entre un estímulo provocador y un estímulo discrimi- 
nativo estoy simplemente sosteniendo que un estímulo puede tener más 
de un tipo de relación con una respuesta. La relación conocida como 
provocación es la más fácil de demostrar y quizás por esta razón se ha 
considerado como única y universal. Pero servir de base a una discri- 
minación es también una función importante, y en realidad es la más 
común. En ambos casos se obtiene el mismo orden temporal de S y R, 
pero no cabe esperar las mismas propiedades cuantitativas. 


C: EL ESTÍMULO REFORZANTE 


Ya hemos descrito con bastante detalle el efecto del estímulo refor- 
zante sobre la conducta y, por tanto, no vamos a ocuparnos de nuevo 
de él con detalle. Un estímulo reforzante es al mismo tiempo un estímu- 
lo provocador o discriminativo, pero su acción, al reforzar un reflejo, 
constituye un efecto separado que puede enumerarse entre las diversas 
funciones de los estímulos. 


256 


Se plantea un caso especial en la retirada de un estímulo negativa- 
mente reforzante, lo cual nos da otro tipo de pseudorreflejo. Por ejem- 
plo interrumpamos un shock productor de espasmos aplicado a la 
cola de un perro tan pronto como éste levante su pata delantera iz- 
quierda.* La interrupción del reforzamiento negativo actúa como refor- 
zamiento positivo; y cuando ha tenido lugar el condicionamiento, un 
shock a la cola será seguido consistentemente por un movimiento de la 
pata delantera. Superficialmente, la reación se parece a un reflejo; pero 
se produciría la mayor confusión si se tratara como tal y esperáramos 
que tuviera sus propiedades usuales. 


D: ELESTÍMULO EMOCIONAL 


Otro tipo de estímulo, que será estudiado con todo detalle en el ca- 
pítulo 11, desempeña la función de establecer un estado emocional. Un 
estado emocional no es una “respuesta” tal como se ha definido aquí, 
y por tanto el estímulo no es provocador. El efecto tiene lugar sobre la 
fuerza del reflejo, como veremos más tarde, y a ese respecto la acción 
del estímulo se parece a la del caso del reforzamiento. Pero mientras 
que el estímulo reforzante afecta a la reserva, el estímulo emocional 
afecta a la proporcionalidad de la reserva y de la tasa. Los estímulos 
facilitadores e inhibidores pueden incluirse en esta clase. 


De forma bastante curiosa, la noción de acicate puede aplicarse a 
tres de esos casos, aunque se limita generalmente al caso especial de 
los estímulos reforzantes. Cuando la respuesta original a un acicate 
tiene la forma exacta deseada, el acicate puede ser: 1) un estímulo pro- 
vocador. Por ejemplo, se hace empezar a andar a un caballo por medio 
de un trallazo. Cuando la respuesta ya está en marcha, puede usarse un 
acicate como 2) un estímulo facilitativo (emocional) para aumentar la 
fuerza. Por ejemplo, puede acelerarse la carrera de un caballo a base 
de fustigarlo. Es difícil separar la acción provocadora y facilitadora en 
este ejemplo, pero la distinción está clara cuando la respuesta es de 
una forma no provocada por el acicate, a saber, cuando se hace que 
un oso domado toque el organillo más rápidamente a base de latigazos. 
El uso más común del acicate es como 3) un estímulo negativamente 
reforzante que al ser retirado se convierte en un reforzamiento positivo. 


2. Mowrer (63) cita un caso de este tipo en que se condicionó a una rata 
a apretar una palanca siempre que se administraba un shock continuo mediante 
una rejilla del suelo. 
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Un ejemplo de ello es el mantenimiento de la carrera de un caballo a 
base de fustigarlo cuando se detiene o desciende por debajo de un ritmo 
determinado. Un ligero toque de la fusta, si precede a un golpe más 
fuerte, puede convertirse en un reforzamiento negativo condicionado y 
tener el mismo efecto. 


Las diversas funciones de los estímulos pueden resumirse de la si- 
guiente forma: 
Un estímulo puede: 


1) Provocar una respuesta (“provocación”). 

2) Determinar la ocasión de una respuesta (“discriminación”). 

3) Modificar la reserva (“reforzamiento”), o bien, 

4) Modificar la proporcionalidad de la reserva y la fuerza (“emo- 


y 


ción”, “facilitación” e “inhibición”). 


Estos son los modos en que el ambiente entra en una descripción de 
la conducta. Son todos ellos de la mayor importancia, y está claro que la 
noción tradicional del estímulo como fuerza impulsora es demasiado 
simple. Se debe insistir en las distinciones de esta índole si queremos 
lograr una ciencia de la conducta cuantitativa y ordenada. 

Pese a estas diferencias todos los estímulos son semejantes en cuan- 
to constituyen partes aislables de las energías o substancias que afectan 
al organismo. El procedimiento de análisis depende en cada caso de la 
función. La naturaleza genérica del estímulo sólo se demostró para los 
estímulos provocadores en el capítulo 1, pero el argumento también 
se mantiene para los otros tres tipos. La correlación con una respuesta, 
la cual (junto con los cambios dinámicos de la correlación) define al 
estímulo provocador, está ausente en el caso del estímulo discriminati- 
vo, pero la propiedad definitoria esencial puede determinarse compa- 
rando las fuerzas de una operante en presencia de diversos casos particu- 
lares. Así, si una rata ha desarrollado una fuerte operante sSP: tono. R la 
fuerza puede resultar independiente de la intensidad del tono a lo largo 
de una gama considerable, aunque como en el caso del estímulo provo- 
cador los valores extremos afectarán al resultado, y la posible pertinencia 
de valores menos extremos queda con ello indicada. Asimismo, es posible 
mostrar que un estímulo emocional o reforzante (condicionado o incon- 
dicionado) es efectivo, prescindiendo de sus diversas propiedades me- 
nores. 

Puedo añadir que los estímulos emocionales y discriminativos, y po- 
siblemente los estímulos reforzantes, también presentan sumación tem- 
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poral, así como otras propiedades temporales a investigar en el capítulo 
siguiente. 


Las diversas funciones de los estímulos condicionados 


El condicionamiento tipo S se basa en la presentación aproximada- 
mente simultánea de dos estímulos. Puede tener lugar aun cuando S* 
no sea un estímulo provocador, y las posibilidades adicionales surgen 
de: 1) estímulos discriminativos condicionados; 2) reforzamientos con- 
dicionados; 8) estímulos emocionales condicionados. Con objeto de ex- 
presar casos de este tipo podemos establecer el paradigma siguiente: 


MS . Ro 
eS a 
Si e — (efecto discriminativo, 
reforzante o emocional) 


en que el efecto de $ es sustituido por R* y queda correlacionado con $S'. 
q P y q 


A: ESTÍMULOS EMOCIONALES CONDICIONADOS 


Un efecto emocional condicionado ya fue utilizado en la página 171. 
Se expresa de forma relativamente simple diciendo que un estímulo ac- 
cidental que acompaña a un estímulo emocional adquiere el poder de 
establecer un efecto emocional gracias al condicionamiento tipo S, 


B: ESTÍMULOS REFORZANTES CONDICIONADOS 


De acuerdo con Pavlov, un estímulo condicionado tipo S puede ser 
sustituido por S' para establecer un reflejo condicionado “secundario”. 
Por ejemplo, cuando el estímulo S4: sonido del metrónomo, se ha con- 
dicionado fuertemente, puede utilizarse para condicionar un estímulo S3 
“más o menos neutral” si este último lo acompaña, S*. R, por supuesto, 
no tiene que reforzarse cuando se presenta SB, porque entonces el 
reforzamiento actuaría directamente sobre S*.R. Durante el condicio- 
namiento secundario la fuerza de S4.R debe mantenerse interpolando 
reforzamientos separados. Entonces tenemos una serie de reforzamien- 
tos de SA. R interrumpidos ocasionalmente por la presentación combi- 
nada no reforzada de SA y SB, Pero este es el procedimiento exacto para 
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establecer una discriminación basada en la pertenencia de un estímulo 
componente. En el caso del condicionamiento secundario el resultado 
debería ser un aumento de la fuerza de SB. R, pero en el caso de la 
discriminación la respuesta a la presentación simultánea de SA y SB 
debiera extinguirse. Según Pavlov, puede ocurrir cualquiera de los dos 
resultados opuestos, de acuerdo con la relación temporal de SA y SB, 
y en raros casos pueden ocurrir conjuntamente. Para establecer un con- 
dicionamiento secundario “el nuevo estímulo debe retirarse algunos 
segundos antes de que se aplique el estímulo primario” ([64], p. 83). 
El punto crítico de los estímulos de intensidad ordinaria es de unos 
10 segundos. Con estímulos fuertes el intervalo puede llegar a ser 
de 20 segundos y proporcionar aún una discriminación en vez de un con- 
dicionamiento secundario. 

Cuando el condicionamiento secundario y la discriminación ocurren 
conjuntamente tiene que haber un aumento de (SB*,R), una disminu- 
ción de (S4 SB, R), y presumiblemente un mantenimiento de (S4.R). 
No hay nada contradictorio en ello, pero el desarrollo de un condicio- 
namiento secundario bajo tales circunstancias es sorprendente. Me in- 
clino a dudar de la realidad del condicionamiento secundario de una 
respondiente en general. En todo caso, la arbitrariedad del tiempo hace 
que el hecho sea de una aplicación extremadamente limitada fuera del 
laboratorio, como ya he dicho. Los datos reales proporcionados por Pav- 
lov son de pequeñas magnitudes, y hay varios tipos de técnica posibles. 
Por ejemplo, la falta de especificidad de la respuesta salivar a estímulos 
incondicionados plantea la posibilidad (como en el caso de la “desin- 
hibición”) de que la salivación se deba directamente al nuevo estímulo. 
Además, los pares de estímulos usados por Pavlov (verbigracia, un tono 
de 760 d. v. y un sonido de agua burbujeante) no están ciertamente li- 
bres de interacción inductiva. 

El uso de un estímulo reforzante condicionado en el tipo R no plan- 
tea una dificultad similar. Este estímulo puede ser un estímulo condi- 
cionado tipo S o un estímulo discriminativo tipo R. Como ejemplo del 
primero, correlacionemos un tono con la presentación de comida. Toda 
operante reforzada por el tono aumentará de fuerza. El tono no debe 
ser reforzado en tales ocasiones, pero su reforzamiento separado pue- 
de ser efectuado sin perturbar el condicionamiento de la operante y sin 
establecer una discriminación. Podría establecerse un caso semejante 
de condicionamiento negativo, como cuando un tono que ha precedido 
a un shock es producido por una operante y la operante declina en 


y 


fuerza. Como ejemplo del segundo caso hagamos de una luz un estímu- 
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lo discriminativo correlacionado con el reforzamiento de la respuesta a 
la palanca. Toda respuesta que produzca la luz aumentará su fuerza. 
Ya veremos que ambos procesos se hallan íntimamente conectados con 
el encadenamiento de los reflejos descrito en el capitulo 2, 

Podemos describir ahora un experimento secundario en el que se 
añade otro miembro a la cadena representativa presente haciendo ac- 
tuar un estímulo discriminativo como un reforzamiento. Se estableció 
primero una discriminación reforzando cada respuesta en un complejo 
de estímulos que incluía la palanca y un estímulo diferenciador SL y 
extinguiendo todas las demás respuestas a la palanca en ausencia de 
Sl. Entonces se creó una situación en que una respuesta arbitrariamente 
elegida condujo a la presentación de Sl, tras lo cual la respuesta discri- 
minativa en presencia de Sl se reforzó inmediatamente. Esto podría 
haberse hecho colocando otra palanca en la caja experimental o usando 
Otro tipo de respuesta; pero el resultado de colocar otra palanca no hu- 
biera sido claro debido a la inducción y hubiese sido difícil obtener una 
respuesta que fuera lo bastante diferente para encontrarse ciertamente 
libre de esta complicación. En el experimento presente se utilizó la 
misma operante. El experimento así representa el caso en que la inter- 
ferencia entre los reflejos III y IV es máxima. La primera respuesta a 
la palanca produjo Sl; una segunda respuesta en presencia de SI pro- 
dujo el sonido del almacén; y la respuesta al comedero después del 
sonido del almacén condujo a la comida. La cadena puede represen- 
tarse gráficamente 


sSV, RV —>¿SU ], RUL> ¿SI pH SI, RI 


Se sometió a un grupo de doce ratas blancas, de unos 140 días de 
edad al inicio del experimento, al programa usual de recondicionamien- 
to periódico a intervalos de cinco minutos.* Todas las ratas adoptaron 
una tasa de respuesta aproximadamente constante. Tras dos días de re- 
condicionamiento periódico se inició una discriminación haciendo so- 
nar un zumbador (como estímulo discriminativo) siempre que la pró- 


3. Con este grupo sólo se obtuvieron siete series completas debido a un fallo 
técnico. Tres series quedaron eliminadas cuando el estímulo diferenciador, por 
accidente, fue dejado conectado continuamente durante unos minutos del primer 
día de la discriminación. En otro caso SÍ estuvo ausente el último día de la 
discriminación debido a un fallo del aparato, y la tasa volvió a ser la característica 
del recondicionamiento periódico. Los registros de esas cuatro series son entera- 
mente compatibles con las presentes conclusiones, pero no pueden incluirse en el 
promedio. En el caso restante, la rata desarrolló un trastorno de laberinto ocasional- 
mente observado en esta situación (ver capítulo 12). 
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xima respuesta iba a ser reforzada. Después de cuatro horas diarias la 
tasa de respuesta en ausencia del sonido había descendido a menos de 
la mitad de su valor original. Al quinto día, el orden de los aconteci- 
mientos fue el siguiente: Cuando se puso en libertad a la rata, el zum- 
bador estaba desconectado. La primera respuesta lo puso en marcha y 
al mismo tiempo completó el circuito hasta el almacén de comida, de- 
jándolo dispuesto para la próxima respuesta. La segunda respuesta, en 
presencia del sonido, fue seguida por la descarga de un gránulo de co- 
mida en un comedero que era accesible a la rata. Entonces se desco- 
nectó el zumbador así como el almacén. Durante los cinco minutos 
siguientes, las respuestas fueron ineficaces. Al cabo de cinco minutos 
se armó de nuevo el aparato (sin suministrar ningún estímulo a la 
rata) de modo que la próxima respuesta conectó el zumbador y la que 
le siguió provocó la descarga del gránulo de comida. Entonces se des- 
conectaron de nuevo la luz y el almacén. Esto se repitió a intervalos 
de cinco minutos durante la hora. Se registraron todas las respuestas a 
la palanca. 

Después de empezar la discriminación, todas las respuestas que pro- 
porcionaron comida tuvieron lugar en presencia del sonido. De acuerdo 
con la evidencia presentada en el capítulo 5, se presumió la inexistencia 
de todo efecto inductivo sobre la operante en presencia del sonido. Las 
respuestas todavía observadas en los intervalos de silencio se debieron 
al recondicionamiento periódico original y debieran haber continuado 
desapareciendo a medida que se efectuaba la curva de discriminación, 
si la correlación nuevamente creada de una respuesta cada cinco mi- 
nutos con la producción del sonido no estuviera surtiendo efecto algu- 
no. El resultado experimental, no obstante, fue que inmediatamente 
después de cambiar a la nueva condición, la tasa de respuesta en silen- 
cio aumentó hasta alcanzar aproximadamente la tasa original. 

El resultado aparece en la curva A de la figura 78, la cual da el 
promedio de las siete series completas. En esta figura no se intenta 
seguir la tasa durante cada hora. Las tasas se representan gráficamente 
con barras horizontales como si fueran constantes. Con el fin de indicar 
el curso del cambio de un día a otro, se han trazado curvas suaves has- 
ta el centro de esas barras. De esa figura parece desprenderse que la 
tasa media de respuesta descendió, durante la discriminación de 202 res- 
puestas por hora al principio del primer día, a 89 por hora al cuarto día. 
Al quinto día, cuando las respuestas en presencia de SÍ produjeron 
entonces el estímulo diferenciador periódicamente (este hecho viene 
indicado en la figura por la expresión RIY—> L), la tasa subió hasta 
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121 el primer día y hasta 168 el segundo. La tasa disminuyó hasta 143 al 
tercer día, indicando que 163 podía haber sido una compensación para 
la baja tasa de 121. 

El promedio de los tres días es de 142, considerablemente por de- 
bajo de la previa tasa de 201 para el recondicionamiento periódico. Es- 
perábamos cierto descenso de esta tasa con el tiempo (ver figura 29), pero 
volviendo al procedimiento del recondicionamiento periódico puede 
mostrarse que no se alcanzó plenamente la tasa periódica. Al octavo 
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LA PRODUCCIÓN DE SD como REFORZAMIENTO 


día SÍ se omitió por completo; periódicamente, entonces, las respuestas 
a SA produjeron, no Sl, sino el sonido del almacén. Las tasas resultantes 
de los dos días sucesivos fueron de 173 y 161 o un promedio de 167, lo 
cual parece todavía un descenso de tasa (más razonable) durante los 16 
o 18 días cronológicos del experimento. La diferencia entre 142 y 167, 
sin embargo, está sujeta a una corrección que haremos más tarde. 
Otro grupo de ocho ratas de unos 160 días de edad había pasado 
por la extensa serie de discriminaciones invertidas tratadas en el capí- 
tulo anterior en que el estímulo suplementario era una luz, pero en la 
que la diferenciación real se había llegado a basar no en la presencia 
O ausencia de la luz, sino en el cambio de una a otra en ambos senti- 
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dos. Las tasas medias de los dos últimos días de la serie fueron de 96 
y 883, respectivamente. La tasa no caía tan rápidamente como esta única 
diferencia parecería indicar. Entonces se cambió de procedimiento de 
manera que las respuestas en la oscuridad periódicamente produjeran 
la luz, tras lo cual se reforzaba una respuesta. El aumento de tasa en 
este caso era prácticamente completo el primer día, como muestra la 
curva B de la figura 78. No disponíamos de tasas periódicas recientes 
con vistas a hacer comparaciones ni tampoco cambiamos de procedi- 
miento pasando al recondicionamiento periódico con este grupo. 

Un tercer grupo de cuatro ratas de unos 170 días de edad había es- 
tablecido una discriminación a la luz sin recondicionamiento periódico 
previo de la forma descrita en el capítulo anterior. Al tercer y cuarto 
días, las tasas medias eran de 44 y 44, respectivamente. Al establecer 
la relación de las respuestas en la oscuridad con SI la tasa ascendió 
a 120, 133 y 139 respuestas por hora, como muestra la curva C de la 
figura 78. 

Un cuarto grupo de cuatro ratas de unos 150 días de edad había 
establecido una discriminación sin condicionamiento previo, asimismo, 
de la forma que hemos descrito anteriormente, en que el componente 
diferenciador era la ausencia de una luz. Al quinto y sexto días de la 
discriminación, las tasas medias eran de 24 y 25 respuestas por hora, 
respectivamente, siendo insignificante el ligero incremento. Al cambiar 
el procedimiento de forma que una respuesta en presencia de la luz 
acarreara su desaparición y la próxima respuesta fuera reforzada, la 
tasa subió hasta 61 respuestas por hora, descendiendo a 50 y 49 los días 
siguientes (curva D de la figura 78). Los valores extraordinariamente 
bajos de esos animales y el incremento relativamente leve se deben en 
parte al método de discriminación, pero también al efecto depresivo 
de la luz. 

El punto importante de esta serie es el primer día de la relación de 
la respuesta en presencia de SA con la producción de Sl. En lenguaje 
corriente: “la rata está aprendiendo a apretar la palanca sólo cuan- 
do Sl se halla presente; ahora tiene que aprender que ella misma está 
produciendo Sl”, El resultado aparece en el presente análisis como un 
cambio del bajo valor de sSA.R que se obtiene bajo la discriminación 
parcialmente completa al obtenido bajo recondicionamiento periódico 
por el estímulo diferenciador. De los datos del primer día se desprende 
claramente que el cambio se inicia muy pronto, pero debemos recurrir 
al estudio de los registros diarios para averiguar su curso real. Estamos 
interesados en cualquier aumento mostrado el día del cambio sobre la 
tasa que cabría esperar de la continuación de la discriminación. Di- 
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cha tasa podría calcularse por extrapolación a partir de la parte superior 
de la curva, pero para nuestros propósitos podemos suponer que la tasa 
que cabe esperar el día del cambio es idéntica a la del día anterior. Cual- 
quier error que esta suposición pueda entrañar va en contra del pre- 
sente argumento. Si sustraemos esta tasa esperada de la tasa realmente 
observada, aparecerá claramente todo incremento que sea producto 
de Sl. Se hicieron mediciones de la altura de las curvas a intervalos de 
diez minutos durante la hora. Los promedios de esos puntos de los 
últimos días de la discriminación se sustrajeron de los primeros días del 
cambio. Los resultados aparecen en la figura 79. Aquí la línea de base 


RESPUESTAS EN EXCESO A 
LAS OBSERVADAS EL DÍA 
ANTERIOR 


RESPUESTAS 


MINUTOS 
Ficura 79" 
EL PRIMER EFECTO DE SD COMO ESTÍMULO REFORZANTE 


Datos de los grupos de la figura 78, que muestran el incremento del número de 

respuestas el primer día en que la aparición periódica de SD se correlaciona con 

una respuesta. Las curvas se obtuvieron sustrayendo los valores del día 4 de la 
figura 78 de los valores del día 5 


constituye en cada caso la curva de sumación media de las respuestas 
del grupo del día anterior. Las curvas muestran los aumentos por enci- 
ma de esta línea de base como el resultado del condicionamiento pe- 
riódico con Sl, 

Es obvio que el efecto se experimenta inmediatamente. En los cuatro 
grupos es evidente un incremento significativo al cabo de diez mi- 
nutos, cuando sólo habían tenido lugar dos reforzamientos. En el gru- 
po A este aumento representa casi por entero el valor pleno; los perío- 
dos sucesivos añaden cada uno de ellos, aproximadamente, el mismo 
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número de respuestas. No obstante, puede advertirse de la figura 78 
que el valor medio de este grupo para el primer día del cambio es bajo, 
y que al día siguiente se produce un ulterior incremento de tasa. En 
los otros tres grupos es aparente un considerable aumento, pero éste 
va seguido más pronto o más tarde de una aceleración más acusada. En 
el grupo B, el incremento máximo se observa entre los 10 y los 20 minu- 
tos posteriores al inicio de la hora; en el grupo C, entre los 40 y 50 mi- 
nutos y en el grupo D, entre los 20 y 30 minutos. Estas diferencias, 
probablemente, reflejan las diversas historias de los cuatro grupos. El 
grupo Á empezó con cierto recondicionamiento periódico y su única 
discriminación no llegó muy lejos. El grupo B tenía una discriminación 
totalmente establecida. El grupo C no había sufrido ningún recondi- 
cionamiento periódico previo que pueda dar cuenta de su aceleración 
retardada. En la figura 80 (pág. 267), reproducimos una serie típica de 
registros reales. 

Esos cuatro experimentos muestran, sin excepción, que la produc- 
ción de un estímulo diferenciador surtió un acentuado efecto reforzante 
y que éste se experimentó inmediatamente. Sin embargo, no es posible 
estimar el valor del efecto de forma muy precisa. Es probablemente del 
mismo orden que el efecto del sonido del almacén, pero una simple 
comparación de las dos tasas periódicas no dará una estimación justa 
por las razones siguientes: 


1. Como Sl es producido por RIY y como RU! le sigue inmediata- 
mente (dentro de dos segundos), SH: sonido del almacén sigue a RIY 
lo bastante cerca como para surtir un considerable efecto reforzante 
sobre ella. Bajo las condiciones indicadas por “R'Y => L” puede decirse 
que una vez cada cinco minutos una respuesta a SIY va seguida dentro 
de dos segundos por SI (sin prestar atención a los acontecimientos in- 
termedios SUI, RU), Como mostramos en el capítulo 4, un intervalo de 
dos segundos entre una respuesta y el estímulo reforzado reduce el 
efecto del reforzamiento aproximadamente en un tercio, Por consi- 
guiente, parte de la tasa periódica desarrollada bajo “RY—=> L” puede 
deberse no a SÍ como reforzamiento, sino a SU; sonido del almacén. 


2. Tampoco está claro si la tasa restante como parte de la discrimi- 
nación debe añadirse a la tasa periódica bajo “RYY—> L”. No sabemos si 
“apretar la palanca para encender la luz” es el mismo reflejo que “apre- 
tar la palanca para hacer sonar el almacén”. Si las consideramos como 
unidades discretas, debe suponerse que sus tasas de provocación sepa- 
radas se suman. Si la presentación de SÍ surte un efecto reforzante 
igual al de SH, sSIV, RIY debiera lograr por sí mismo un valor casi igual 
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al observado al principio del experimento. Pero sSWI, RUI no se en- 
cuentra en absoluto cerca de cero y, en el supuesto de que se vean 
involucrados reflejos separados, la tasa total observada debiera ser ma- 
yor que la originalmente observada para sSUI, RUI sólo. Esto no está 
de acuerdo con nuestro resultado, pero no por ello la suposición puede 


ser desestimada. Es posible que el efecto de Sl sea incluso menor de 
lo que habíamos supuesto. 
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Conjunto de registros de una rata de las figuras 78 y 79, grupo A 


No obstante, es más simple considerar sSUI, RIM y sSIV, RIV como 
el mismo reflejo. Con ello evitamos la cuestión sistemática de cómo 
distinguirlos si no lo son, y podemos explicar fácilmente los presentes 
datos. La vuelta a una tasa superior es comparable con la observada 
durante la abolición de una discriminación mediante el reforzamiento 
del miembro previamente extinguido (figura 58) en que no cabe es- 
perar ninguna sumación. Bajo esta interpretación podemos decir que 
el efecto sumado de SI sobre sSIV. RIV, de SU sobre sSIV,RIV y de SU 
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sobre sSII , RUI gracias a la inducción a partir de sSl. RL, es aproxi- 
madamente igual al de SI sobre sSUt, RUI directamente bajo recondi- 
cionamiento periódico. Pero ello no hace posible una estimación precisa 
del efecto de Sl sólo. 


El experimento arroja alguna luz sobre un problema técnico conec- 
tado con las discriminaciones en general. Cuando se presenta repe- 
tidamente al organismo un estímulo diferenciador, su efecto ocasional 
como estímulo reforzante debe tomarse en consideración. En el pre- 
sente método, si se presenta una luz cada cinco minutos como estímulo 
diferenciador, surtirá un efecto adicional sobre la tasa siempre que su 
presentación coincida con la provocación de una respuesta. En algunos 
de los experimentos precedentes el estímulo diferenciador fue accionado 
a mano, y se observó la costumbre de esperar hasta que la rata no res- 
pondiera muy rápidamente. De esta forma, generalmente se evitaron 
las coincidencias. No obstante, en un análisis profundo de la curva de 
discriminación tenemos que considerar un posible resultado no deseado 
de este procedimiento. Sólo se refuerzan siempre las respuestas siguien- 
tes a un breve período de no-respuesta; en consecuencia, puede desa- 
rrollarse una discriminación que tendrá por efecto la eliminación de las 
respuestas muy agrupadas (ver capítulo 7). Aunque es probable que 
aquí no se experimente ningún efecto sobre la tasa media, no puede 
considerarse que el procedimiento carezca de cierto efecto especial 
En el grupo A del experimento anterior se llevó a cabo todo el expe- 
rimento de forma automática. El estímulo diferenciador era introducido 
periódicamente por un mecanismo de relojería y, desde luego, sin te- 
ner en cuenta la conducta momentánea de la rata. Las curvas de dis- 
criminación no difieren considerablemente de las obtenidas con otros 
métodos, al menos en lo que respecta al presente grado de aproxima- 
ción, pero con un examen más detallado el presente resultado muestra 
muy claramente que debe tenerse en cuenta la posibilidad de una 
coincidencia ocasional. 


En el tipo R podría establecerse un caso semejante de reforzamien- 
to negativo condicionado, permitiendo que una operante produjera la 
retirada de un estímulo discriminativo. Sería más difícil, pero no impo- 
sible, usar también la misma operante en este caso. 


Será conveniente citar aquí algunos experimentos sobre otra cues- 
tión que se realizaron con esos mismos animales y que tienen cierta 
relación con las conclusiones precedentes. Previamente hemos notado 
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una significativa diferencia entre una discriminación en que SD consis- 
tía en la presencia de una luz y otra en que consistía en su ausencia. La 
luz deprime la tasa de provocación. Si el recondicionamiento periódico 
inicial ocurre en ausencia de la luz, la introducción del estímulo dife- 
renciador causará un repentino descenso de tasa cuando la ausencia 
de la luz sea el estímulo diferenciador, porque durante los períodos 
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EN LA DISCRIMINACIÓN 


Las curvas antes descritas se han separado teniendo en cuenta si SD era una luz 
O la ausencia de una luz (o de un zumbador). La presencia de los dos tipos de 
estímulos deprime la tasa 


intermedios de respuesta a SP la luz está encendida. En el grupo A de 
los experimentos precedentes se introdujo un control para evitar la po- 
sibilidad de que una discriminación en la que SP consistía en el sonido 
de un zumbador difiriera de otra en la que SP consistía en la ausencia 
de dicho sonido. 

En la mitad de los casos la discriminación realmente fue lo contra- 
rio de lo que hemos descrito. En la serie que tuvo éxito, SP consistía 
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en la presencia del zumbador en tres casos. En los otros cuatro casos 
el zumbador sólo estuvo ausente durante el recondicionamiento perió- 
dico y, por ello, se halló presente la mayor parte del tiempo. Sobre esta 
base las curvas de este grupo se han separado en dos partes en la figu- 
ra 81 A. Los grupos son reducidos, pero dan alguna indicación de cier- 
ta diferencia. Las líneas horizontales sólidas corresponden a las tres 
ratas para las que SP fue el sonido del zumbador. Las líneas disconti- 
nuas corresponden a las otras. No se produce ningún efecto depresivo 
sobre la tasa durante la discriminación, pero el proceso se ve retardado; 
el descenso de tasa es más lento para el grupo en que la diferenciación 
consiste en la desaparición del sonido del zumbador. Cuando se estable- 
ce la relación entre RYY y SD, podemos ver una diferencia mucho más 
considerable. Cuando la rata está normalmente en silencio, pero pro- 
duce el sonido del zumbador periódicamente, el efecto del reforza- 
miento es grande. Cuando el zumbador suena continuamente, excepto 
cuando se ve silenciado momentáneamente por la respuesta de una 
rata, el efecto del reforzamiento es leve. Al cambiar a recondiciona- 
miento periódico simple, los zumbadores se silenciaron por completo, 
y el grupo deprimido respondió con un aumento de tasa muy signifi- 
cativo. Debido a los bajos valores de esas cuatro ratas los días 5, 6 6 7, es 
posible comparar la tasa media del grupo con la tasa de los días 8 y 9 
bajo recondicionamiento periódico, como ya se señaló antes. 

En el grupo B los ocho casos siguieron la pauta descrita, de forma 
que no se plantea el presente problema. En el grupo C el estímulo di- 
ferenciador consistió en la presencia de una luz; en el grupo D en su 
ausencia. Estos experimentos se corresponden muy bien con los del 
grupo A, mostrando el grupo D sólo una ligera diferencia cuando se 
estableció la relación de RYY y Sl. Los grupos C y D se comprobaron 
posteriormente de forma directa en lo que respecta al efecto de la luz, 
que resultó ser relativamente grande. Las series completas de ambos 
vienen dadas en la figura 81. En el caso del grupo C (curva superior 
de la figura 81) el retorno al recondicionamiento periódico (noveno día) 
acarreó un aumento probablemente significativo sobre la tasa previa 
bajo el reforzamiento a partir de SÍ. Este grupo es homogéneo y cons- 
tituye la única evidencia clara en el experimento de que la cadena 


sSHI, RU... etc. 
se provoca algo más rápidamente que 
sSIV, RIV ... etc. 


Durante este recondicionamiento periódico simple la luz estuvo apa- 
gada. Al undécimo día se encendió continuamente empezando a los 
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25 minutos. Las restantes condiciones permanecieron inalteradas. Como 
la luz en este punto constituye todavía un estímulo diferenciador y 
como las respuestas en presencia de la luz dejan de reforzarse, a no ser 
periódicamente, se produce una curva de extinción. En la figura 82, 
curva C, reproducimos un registro típico. La convexidad que puede 
observarse al principio de la curva es un efecto accidental. La línea ho- 
rizontal que corta la curva marca el inicio de la curva de extinción de 
sSI.R. La curva cae rápidamente cuando el efecto depresivo de la luz 
emerge sobre su carácter excitatorio como estímulo diferenciador. La 
tasa media de este día, incluyendo la curva de extinción, es ya inferior 
a la del día anterior, y al día siguiente se mantiene un valor extraordi- 
nariamente bajo (registro omitido en la figura 82). Al día siguiente la 
luz se apaga después de transcurridos veinte minutos. La tasa sube de 


RESPUESTAS 


TIEMPO 


FIGURA 82 17 
REGISTROS DIARIOS QUE MUESTRAN EL EFECTO DEPRESIVO DE UNA LUZ 


C: Reforzamiento periódico en ausencia de wma luz. En la línea horizontal se pre- 
sentó la luz. Su primer efecto fue un estímulo discriminativo (cf. figura 60) dando 
una curva de extinción. Tras ello la tasa fue deprimida por la luz. C*: al segundo 
día siguiente a C la tasa se halla deprimida todavía por la luz y sube inmediata- 
mente cuando se apaga la luz (en la línea vertical). D: reforzamiento periódico en 
presencia de una luz. En la discriminación que había precedido a este experimento 
la ausencia de la luz había sido SD. Cuando ahora se apaga la luz, por lo tanto, 
se obtiene una curva de extinción como en C, si exceptuamos que ahora sobreviene 
un aumento de la tasa de respuesta. D': al segundo día siguiente a D la tasa 
incrementada todavía está en vigor, pero el efecto de la luz presentada en D' es 
una supresión casi completa 
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nuevo, aunque no alcanza completamente su elevado valor anterior. En 
la curva C” de la figura 82, la barra vertical marca el cambio a la “luz 
apagada”. El promedio del grupo, representado en forma de tasa en 
lugar de en forma de número respecto al tiempo, viene dado en la fi- 
gura 81 C. 

Una importante característica del registro C* de la figura 82 es la 
ausencia completa de todo aumento compensatorio de tasa después 
de la desaparición del estímulo depresivo. La depresión es claramente 
diferente de los casos antes citados en que toda tendencia a suprimir 
la tasa va seguida por una acusada compensación. 

En el caso del grupo D (curva D de la figura 81) la luz está encendida 
durante el recondicionamiento periódico simple (décimo día de la grá- 
fica) y la tasa no muestra incremento alguno como resultado del cam- 
bio a partir de RIY—> SI, Al día siguiente, la luz se apaga después de 
transcurridos 25 minutos. Sigue una curva de extinción por la misma 
razón que en el caso del grupo C. Aquí, no obstante, conduce a una 
. tasa considerablemente incrementada, un ejemplo típico de lo cual vie- 
ne dado en la curva D de la figura 82. Tras dos días de esta tasa (omi- 
tidos en la figura 82) la luz se enciende de nuevo y la tasa desciende 
hasta su bajo nivel anterior. En el caso particular de la curva D' (figu- 
ra 82) el efecto es especialmente grande después de presentar la luz 
(en la barra vertical). Hacia el final de la hora es evidente un ligero 
restablecimiento. 


C: ESTÍMULOS DISCRIMINATIVOS CONDICIONADOS 


El condicionamiento de los estímulos discriminativos en el tipo R 
plantea la misma dificultad que en el condicionamiento secundario 
tipo S. Supongamos, por ejemplo, que una luz se ha convertido en el 
estímulo discriminativo de la respuesta de apretar una palanca. Si un 
tono precede a la luz con frecuencia suficiente, debiera llegar a con- 
vertirse, asimismo, en estímulo discriminativo. Aquí, una vez más, el tono 
no debe preceder a la luz cuando la operante es reforzada o el efecto 
del reforzamiento sea directo. Pero una serie en que sSD: luz.R es re- 
forzada ocasionalmente pero sSP: tono SD: luz.R no lo es, debería 
establecer otra discriminación en que sSP: tono SD: luz.R declinara. 
En la medida de mis conocimientos, no hay ninguna evidencia experi- 
mental disponible sobre este punto. 


El pseudorreflejo y el intento de extender el tipo S 
a la conducta operante 


Los diversos tipos de pseudorreflejos descritos en las páginas anterio- 
res arrojan alguna luz sobre las dificultades que ha planteado el inten- 
to de extender el tipo pavloviano de condicionamiento (tipo S) a la con- 
ducta condicionada en general. La imposibilidad de conseguirlo debiera 
quedar patente con la comparación de los dos tipos facilitada en el 
capítulo 3. En muchos casos, los “reflejos condicionados” esqueléticos 
establecidos sobre la analogía del tipo S son pseudorreflejos basados en 
el tipo R. La literatura actual contiene descripciones de muchos dispo- 
tivos para el estudio del condicionamiento que pretenden trazar un 
paralelo con el sistema pavloviano, pero que utilizan ejemplos de este 
tipo. El condicionamiento tipo R puede entrar en un experimento que 
intencionalmente es sólo del tipo S porque la mayor parte de los estímu- 
los que provocan respondientes esqueléticas (flexión, sobresalto, parpa- 
deo, etc.) funcionan como reforzantes negativos del tipo R. La cesación 
del estímulo actúa como un reforzamiento positivo, que puede correla- 
cionarse con algún aspecto de la respuesta para producir un condicio- 
namiento tipo R. Al describir el establecimiento de una respondiente 
esquelética condicionada, es importante examinar la relación temporal 
de la respuesta con la cesación del estímulo reforzante. En el ejemplo 
típico de un reflejo de flexión condicionada se presentan dos posibili- 
dades o, si suponemos que la respuesta al shock no es sólo una flexión, 
sino un leve clono en una posición flexionada, tres posibilidades. 

1) En el primer caso la cesación del shock no está correlacionada 
estrechamente con ninguna parte del movimiento del miembro. El shock 
persiste lo bastante como para no reforzar la flexión original muy fuer- 
temente cuando cesa, y se hace de tal forma que su cesación coincide 
al azar con las etapas flexivas y extensivas del clono. Bajo estas con- 
diciones, el reflejo de flexión persistirá si el estímulo es fuerte y si no se 
provoca con la frecuencia suficiente como para causar fatiga. 2) En 
el segundo caso, la ocasión del shock sigue inmediatamente a la flexión. 
Esto puede conseguirse mecánicamente si la pata del animal está pre- 
sionada contra el electrodo de forma que el contacto se interrumpa 
con la respuesta. Las circunstancias requeridas también se dan si la 
duración del shock supera ligeramente la latencia del reflejo. Si el es- 
tímulo es fuerte, el condicionamiento tipo R puede verse oscurecido, 
pero si es débil y la respondiente se adapta, la respuesta condicionada 
permanecerá. Tomará una forma que vendrá dictada por las condicio- 
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nes de la correlación de los reforzamientos. Un ejemplo corriente es la 
respuesta condicionada a una plancha caliente; la primera respuesta 
puede ser una fuerte respondiente, que se adapta para dejar una sim- 
ple operante, cuya magnitud es sólo lo bastante grande para interrum- 
pir el contacto con la plancha. 3) En el tercer caso la cesación del shock 
es contingente a una fase extensiva del clono. La flexión seguida por 
la extensión es reforzada como una operante. La fuerte extensión que 
se desarrolla no se ve tan fácilmente oscurecida por la flexión respon- 
diente, y aun cuando el estímulo sea fuerte y la respondiente esté in- 
tacta, se observará la fuerte operante condicionada formada por el mo- 
vimiento extensivo. Si la respondiente es débil, se produce la flexión 
como una parte necesaria de la operante. Este tipo de contingencia no 
es raro fuera del laboratorio. En el conocido ejemplo “natural” del re- 
flejo de flexión en que un perro pisa una espina, supongamos que dicha 
espina permanezca en su pata hasta que sea desalojada por su propia 
inercia como consecuencia de un brusco movimiento hacia abajo de la 
pata. El resultado es la respuesta adquirida de sacudir una fuente de 
estimulación nociva. 

Estos casos se dan simplemente a partir de la estimulación por par- 
te de un shock y se distinguen por los diferentes momentos de su cesa- 
ción. No se ha introducido aún ningún estímulo incondicionado (verbi- 
gracia, un tono) y, por lo tanto, el condicionamiento tipo S todavía no 
es posible, Cuando se introduce un tono surgen las posibilidades si- 
guientes: Si el tono está correlacionado con un shock terminado como 
en el caso 1, tal vez pueda establecerse un verdadero reflejo condicio- 
nado tipo S. El tono puede producir al fin una breve flexión de la pier- 
na. Cuando está correlacionado con un shock terminado como en el 
caso 2, el tono se convierte en un estímulo discriminativo para la ope- 
rante resultante. Cuando la respuesta se emite antes del shock, en reali- 
dad no se produce reforzamiento alguno, ni positivo ni negativo, y esta 
operante discriminada no puede mantener su status condicionado. La 
presentación repetida del tono extinguirá la respuesta hasta que se re- 
ciba de nuevo un shock porque no se ha realizado una respuesta. Cuan- 
do un tono está correlacionado con un shock terminado como en el 
caso 3, surge una Operante discriminada en que la respuesta es una fle- 
xión y una extensión. Como en el caso 2, la provocación repetida de la 
respuesta la extinguirá porque cuando se emite la respuesta no sigue 
ningún reforzamiento. Es posible un cuarto caso si la cesación del tono 
está correlacionada con la respuesta. A causa de la contigitidad del tono y 
del shock, el tono se vuelve negativamente reforzante según el tipo S 
y su cesación, por tanto, se vuelve positivamente reforzante. La res- 
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puesta se emite porque previamente ha sido seguida por la cesación de 
un reforzamiento negativo condicionado. 

El segundo caso es la forma más común de un intento de extensión 
tipo S que implica el tipo R. Aparece en la mayoría de las técnicas des- 
tinadas al estudio de la conducta motora condicionada. Podemos enu- 
merar cuatro ejemplos: a) El aparato de Watson para la retirada con- 
dicionada del dedo (75), en que el movimiento del dedo interrumpe el 
circuito productor del shock; b) el aparato de Hunter usado con ra- 
tas (52), en que un shock sigue a un zumbido con tal que no se haya 
emitido ninguna respuesta; c) la técnica de Hilgard y Marquis para el 
condicionamiento del cierre reflejo del párpado del ojo (descrito en [48]), 
en que el cierre del párpado interrumpe el estímulo incondicionado de 
un soplo de aire a la córnea; y d) el dispositivo de Brogden y Culler 
para el condicionamiento motor de pequeños animales (34), en que un 
“gato, al girar la jaula más de una pulgada cuando da comienzo (un) 
sonido, escapa al shock interrumpiendo el ... circuito”. 

La conducta real obtenida en cualquiera de esos procedimientos no 
muestra la sustitución de un estímulo en un reflejo incondicionado tal 
como requiere la fórmula pavloviana. La conducta es una operante dis- 
criminada, y la secuencia de la respuesta y reforzamiento es evidente- 
mente del tipo R. Una consecuencia de esta naturaleza operante es que la 
forma de la respuesta condicionada no tiene por qué ser idéntica a 
la del reflejo incondicionado en respuesta al estímulo reforzante. La for- 
ma de la respuesta que interrumpe una corriente productora de un 
shock no tiene por qué ser la misma que la respuesta incondicionada 
al shock. Aun cuando el procedimiento no suministre una correlación 
entre la respuesta y la cesación del estímulo reforzante negativo, puede 
obtenerse el mismo resultado si el estímulo es frecuentemente interrum- 
pido por la respuesta en la vida del organismo fuera del laboratorio (ver 
el apartado anterior sobre Estímulos discriminativos condicionados), 
que es lo que sucede en los ejemplos que acabamos de citar. 


Superposición de una operante y una respondiente 


Cuando una operante y una respondiente se superponen topográfi- 
camente, puede crearse un caso experimental que parece tener propie- 
dades únicas. Este caso ha sido descrito por Konorski y Miller (56, 57). 
Un shock a la pata de un perro hambriento provoca una flexión y en- 
tonces se le da comida; al final se produce la flexión en ausencia del 
shock. El caso puede interpretarse de la forma siguiente: La operante 
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s.R: flexión es débil y aparece sólo ocasionalmente. La fuerte respon- 
diente S. R tiene más o menos la misma forma de respuesta, y debemos 
suponer que su provocación desencadena al mismo tiempo a la ope- 
rante, la cual se suma con ella. En realidad tenemos dos secuencias: 
S*: shock. R*: flexión y s.R*:flexión > S': comida. La respondiente 
S*.R* no tiene por qué incrementar su fuerza porque vaya seguida 
de S', pero puede al contrario disminuirla (ver página 84). Pero la ope- 
rante s. R* aumenta en fuerza hasta un punto en que es capaz de apa- 
recer sin la ayuda de la respondiente. La existencia de los dos compo- 
nentes independientes viene demostrada por el hecho de que la operante 
al fin aparece sin la respondiente cuando se ha hecho lo bastante fuerte 
gracias al condicionamiento y de que puede incluso condicionarse sin 
la ayuda de la respondiente aunque con menor facilidad porque al me- 
nos tiene que obtenerse una ocurrencia incondicionada. 

Así, pues, hay una importante diferencia entre la secuencia “shock 
flexión, comida” y la secuencia “palanca, presión, comida”. La primera 
de ellas contiene una respondiente. Como no hay ningún estímulo pro- 
vocador en la segunda secuencia, la comida se correlaciona con la res- 
puesta, pero no con la palanca como estímulo. En la primera secuencia 
la comida está correlacionada tan plenamente con el shock como en la 
flexión, a causa de la conexión necesaria (es decir, la provocadora en 
lugar de la discriminativa) entre el estímulo y la respuesta. El caso de 
Konorski y Miller no se ajusta a ninguno de los dos tipos de condiciona- 
miento en tanto se mantiene la doble correlación. El condicionamiento 
tipo S ocurrirá (el shock-salivación estudiado en el capítulo 3), pero en 
lo que concierne a la economía del organismo, no hay ninguna razón 
por la que el condicionamiento tipo R deba ocurrir en tanto haya siem- 
pre una correlación entre el reforzamiento y un estímulo provocador. 
En tal caso no se gana nada; la secuencia original opera de la forma 
más eficaz posible. En la naturaleza, la correlación de un estímulo re- 
forzante con una respondiente es muy rara, si es que podemos afirmar 
que exista. Puede existir cuando la forma de una respondiente se su- 
perpone con la de una operante correlacionada con un reforzamiento. 

Se plantea un caso especial de superposición de una respondiente 
con una operante cuando esta última se refuerza regenerando un refor- 
zamiento negativo. Tradicionalmente, se designa como el control volun- 
tario de una respuesta involuntaria. Por ejemplo, correlacionamos un 
reforzamiento negativo con el cierre de los ojos (de forma que la aper- 
tura de los mismos o el estado de tenerlos abiertos se vean reforzados 
positivamente) y presentemos un estímulo causante de un parpadeo. El 
resultado puede tratarse en términos de una sumación algebraica. Si 
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la operante de mantener los ojos abiertos es fuerte, puede que no se 
produzca ninguna respuesta. Es decir, la respuesta “involuntaria” será 
“controlada”. En este ejemplo, sin embargo, probablemente siempre 
es posible hallar un estímulo para la respondiente de una intensidad 
que invariablemente provoque la respuesta a pesar de la oposición de 
la operante. 
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1. La discriminación temporal 
del estímulo 


El tiempo como un continuo discriminable 


El estudio científico de la discriminación sensorial fue estimulado 
por el movimiento filosófico conocido por el nombre del empirismo 
británico, el cual destacó la importancia de los “datos sensoriales” en 
la comprensión de la mente humana. Fue proseguido principalmente 
como parte de una ciencia de la mente basada en la doctrina de los 
“elementos mentales”. Desde el principio se ha interesado en gran par- 
te por los mecanismos empleados en la recepción de los estímulos y, es- 
pecialmente, por la determinación de sus capacidades liminales. 

Ahora bien, en una ciencia de la conducta, la investigación a fondo 
del umbral como un único aspecto del proceso de discriminación sólo 
surgiría en un estadio relativamente avanzado. Inicialmente, es de ma- 
yor importancia saber lo que sucede cuando se hace una discriminación, 
un problema que ha sido evitado por la ciencia mental a causa de sus 
premisas metafísicas referentes a la actividad del organismo en cuanto 
sujeto de experiencia. Sin embargo, existe una cuestión de la capacidad 
que no puede ignorarse en las primeras etapas del estudio de la discri- 
minación como un aspecto de la conducta. La formulación de este im- 
portante proceso debe depender hasta cierto punto de la naturaleza de 
lo que se discrimina, y es necesario conocer las diversas propiedades 
de los estímulos a los que un organismo es capaz de responder diferen- 
cialmente. La lista dada en el capítulo 5 de los continuos sensoriales 
sobre los que los pares de estímulos podían diferir no pretendía ser ex- 
haustiva, y sólo haré algunas adiciones sobre las propiedades tempora- 
les. Formulado de forma más general, el problema consiste en averiguar 
qué importancia tiene el tiempo, como una dimensión de la naturaleza, 
en la conducta discriminativa y, a través de ella, en el conocimiento 
humano. 

Hay ciertas “discriminaciones” temporales que no se designan apro- 
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piadamente como tales. Estas “discriminaciones” surgen porque la con- 
ducta necesariamente tiene lugar en el tiempo. Alterando las condiciones 
temporales de cualquiera de los procesos dinámicos definidos en el ca- 
pítulo 1, es posible cambiar el estado resultante de la conducta, demos- 
trando así lo que podría llamarse una “respuesta diferencial al tiempo”. 
Por ejemplo, en el capítulo 4 se demostró que la tasa de respuesta 
durante el recondicionamiento periódico estaba en función del período. 
El estado del reflejo se ajusta rápidamente a un cambio, pongamos por 
caso, de cinco a seis minutos entre los reforzamientos, y por tanto 
podría decirse (equivocadamente, a mi juicio) que el organismo distin- 
gue entre los intervalos de cinco y seis minutos. Asimismo, en los capí- 
tulos 3 y 4 se mostró que el efecto de un reforzamiento en el condicio- 
namiento tipo R estaba en función del tiempo que transcurre entre éste 
y la respuesta correlacionada con él. Se demostró una diferencia en el 
estado resultante cuando se retrasó el recondicionamiento periódico 

en cuatro y seis segundos, y podría decirse que el organismo “distin- 
guía” entre esos intervalos. Los experimentos destinados a comprobar 
el “umbral temporal” de la rata a menudo emplean procesos dinámicos 
de este tipo y en realidad no implican ninguna discriminación temporal 
tal como la definiremos aquí. Por ejemplo, puede retenerse a una rata 
durante diferentes períodos de tiempo mientras está recorriendo va- 
rios caminos distintos en busca de comida. La rata llega a tomar el ca- 
mino en el curso del cual ha sido interceptada el tiempo más breve. El 
efecto de una retención dada es retrasar el reforzamiento de la respuesta 
de tomar aquel camino. Un caso comparable podría consistir en dispo- 
ner dos palancas, de forma que las respuestas a la primera fueran refor- 
zadas después de dos segundos y las respuestas a la segunda lo fueran 
después de ocho. La rata llegaría a responder a la palanca de dos se- 
gundos, no porque hubiera hecho una discriminación entre los dos y 
los ocho segundos, sino porque la respuesta a la palanca de dos segundos 
sería reforzada con mayor vigor. 

Otro uso del término “discriminación temporal” que queda fuera 
de la definición que daremos aquí se plantea en el tratamiento de los 
estímulos provocadores. Las propiedades temporales de un estímulo 
provocador, sin duda alguna, son importantes. Según la ley de la suma- 
ción temporal, la prolongación de un estímulo tiene el mismo efecto 
que un aumento en su intensidad, y podría definirse una especie de 
umbral temporal como el cambio mínimo de la duración de un estímulo 
necesario para producir una diferencia detectable en la magnitud de 
una respuesta. Este umbral no requiere condicionamiento para su demos- 
tración y difiere fundamentalmente del umbral discriminativo que va- 
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mos a considerar aquí. La médula de una rana, por ejemplo, puede 
“distinguir” entre un estímulo que dure tres segundos y uno que dure 
cuatro dando respuestas de diferentes magnitudes, pero eso no es lo 
que se entiende ordinariamente por discriminación temporal. 

Los fenómenos que designamos aquí por discriminación temporal 
pueden formularse de la manera siguiente: En el establecimiento de 
una discriminación (en contraste con la provocación de una respuesta) 
las propiedades temporales de un estímulo adquieren una nueva sig- 
nificación. Tanto en el condicionamiento tipo S (que en la práctica siem- 
pre implica una discriminación) como en la discriminación tipo R ya 
descrita en el capítulo 5, se correlaciona temporalmente un estímulo 
con otro acontecimiento: la presentación de un estímulo reforzante. 
La correlación temporal hace posible individualizar un punto dado en 
el continuo establecido a través de la presentación sostenida de un es- 
tímulo. Por ejemplo, presentemos un tono y mantengámoslo durante 
cierto tiempo, En lo que respecta a la provocación de una respuesta, 
el único efecto debido a la prolongación es el efecto sumativo resultan- 
te. Pero cuando establecemos una relación coincidente entre un segundo 
acontecimiento y algún punto situado a lo largo del estímulo prolonga- 
do, el organismo puede empezar a distinguir entre el estímulo situado 
momentáneamente en ese punto y el mismo estímulo situado momen- 
táneamente en algún otro punto, reaccionando diferentemente a los dos 
de una forma precisamente no acumulativa. Según el empleo que va- 
mos a dar al término aquí, esto constituye una discriminación temporal. 

Las partes sucesivas de un estímulo continuo serán indicadas de la 
manera siguiente: Se divide el continuo en partes de una duración ar- 
bitraria mediante el uso de un mecanismo de relojería. Podemos seguir 
la división aceptada en segundos, minutos, etc., o bien utilizar alguna 
Otra unidad conveniente. Por ejemplo, puede ser conveniente dividir. 
un estímulo que dure dos minutos en ocho partes de quince segundos 
cada una. Cuando se presenta por primera vez, el estímulo puede re- 
presentarse gráficamente Sto. Al fin de una división arbitraria puede 
escribirse Str, al fin de una segunda división Stz y así sucesivamente. Si 
se presenta un estímulo y se retira inmediatamente, puede funcionar 
posteriormente de la misma forma que un estímulo prolongado. (Aquí 
no hay ningún paralelo en el caso de la provocación porque no cabe 
la posibilidad de un efecto sumativo.) Este estímulo puede representarse 
en el momento de su presentación como S-+to. Después de haber trans- 
currido una unidad de tiempo (habiendo sido retirado el estímulo) pue- 
de representarse como $ + ti, después de transcurrir una segunda como 
S+tz, así sucesivamente, 
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La discriminación temporal tipo S 


Los dos casos más destacados de discriminación temporal tipo S 
son los llamados reflejos condicionados “retardados” y “de huella” de 
Pavlov ([64], pp. 40-41, 88-105). Como demostraré más tarde, no se tra- 
ta más que de pseudorreflejos. La observación básica en el caso del “re- 
flejo retardado” es la siguiente: Establezcamos primero un reflejo 
condicionado con Sto y retardemos luego el reforzamiento de tal forma 
que Sto. R se extinga pero que St, . R sea reforzado. Cuando se ha es- 
tablecido la discriminación, la presentación del estímulo no va seguida 
por una respuesta hasta que ha transcurrido una unidad de tiempo. Por 
etapas graduales puede incrementarse el intervalo hasta que la respues- 
ta se produzca sólo cuando se haya alcanzado el estadio máximo de St». 

Con un organismo como el perro, la propiedad de la duración no es 
altamente significativa en el establecimiento de una discriminación. Se 
produce una inducción considerable entre los puntos cercanos del con- 
tinuo, y la fuerza de los reflejos diferencialmente reforzados se separa 
de una forma muy lenta. A causa de la fuerte inducción, generalmente 
se obtiene un gradiente de manera que las fuerzas de los reflejos en 
puntos sucesivos del continuo pueden variar más o menos de la forma 
siguiente : 


[Sto.R] =0 
[St .R] =0 
[St .R] =1 
St RA = 8 


[Sta . R] =7 (valor máximo) 


Al parecer puede establecerse una discriminación temporal de este 
tipo sin necesidad de empezar con el reforzamiento de Sto. R. El es- 
tímulo reforzante originalmente sólo podía presentarse tras algún inter- 
valo arbitrario, pero según Pavlov la discriminación es difícil de ejecutar 
de esta forma. Mediante la inducción se desarrolla una respuesta a Sto, 
aunque nunca se ve reforzada de acuerdo con las condiciones del ex- 
perimento. Se produce la extinción y finalmente se obtiene la respuesta 
retardada. Si se condiciona originalmente Sto. R y luego se introduce 
inmediatamente un largo intervalo sin aproximaciones sucesivas a través 
de pequeñas etapas graduales, el reflejo puede desaparecer por comple- 
to. Según Pavlov, la respuesta aparece de nuevo en el punto del refor- 
zamiento y avanza hasta una “posición intermedia entre el inicio del 
estímulo condicionado y su reforzamiento” (pág. 106). 


281 


La posibilidad de una discriminación de este tipo es de gran impor- 
tancia en el estudio del condicionamiento tipo S. menos que S” y S” 
sean presentados simultáneamente, más pronto o más tarde se desarro- 
llará una discriminación temporal, y entonces carece de sentido utilizar 
la “latencia” del reflejo condicionado como medida de su fuerza. La 
crítica es importante porque frecuentemente se introduce un intervalo 
de tiempo entre S” y S! con objeto de observar la fuerza de S*. R sin 
retirar S', Aparte de la invalidación de la latencia como medida, el 
procedimiento no puede dar resultado para el propósito para el que 
se ha creado debido a la posibilidad de una discriminación temporal. 
Aunque puede producirse cierta respuesta “anticipatoria” en virtud de 
la inducción de Stn sobre Sta — 1, no es la respuesta entera. Parte de la 
respuesta condicionada puede verse oscurecida por la respuesta incon- 
dicionada a S! si dicho estímulo no es omitido. 

En un reflejo “de huella” el estímulo se presenta y se retira, y el 
reforzamiento tiene lugar algún tiempo más tarde. En este caso tiene 
lugar el mismo tipo de discriminación. La inducción entre S + to y 
S + ta es aparentemente mucho mayor que la que se produce entre 
Sto y Stn, y el fenómeno se establece con gran dificultad cuando el re- 
forzamiento se correlaciona originalmente con un S + tn relativamente 
tardío. El procedimiento más conveniente es empezar con S + to e in- 
troducir progresivamente retrasos mayores, 

Una simple variante de este tipo de discriminación se obtiene cuan- 
do se presenta a un organismo un estímulo reforzante a cierta tasa de- 
terminada. Pavlov cita un experimento en el que cada treinta minutos 
se presentaba comida a un perro. Finalmente, el perro empezó a se- 
gregar saliva aproximadamente en el momento en que se le iba a pre- 
sentar la comida. En este caso S es la presentación de la propia comida 
y el perro llega a emitir una respuesta discriminativa a S + tw solo. 
Con este largo intervalo, Pavlov no habla de ninguna inducción “anti- 
cipatoria”, por ejemplo, a S + t», sino, por el contrario, de un retraso 
ocasional a S + ta 0 S + ta, 

Ya hemos observado (pág. 207) que cuando se toma como medida 
de una discriminación la diferencia de las fuerzas de un reflejo en pre- 
sencia de SP y S%, debe considerarse el estado del impulso. En las pri- 
meras etapas de una discriminación puede obtenerse una respuesta a 
SP y no a S% si el impulso es bajo, aunque la diferencia real de fuerza 
sea baja. Esto es particularmente significativo si la estimulación discri- 
minativa es pequeña y, por tanto, la discriminación es difícil. La natu- 
raleza esencialmente discriminativa de lo que Pavlov llama un reflejo 
de huella se demuestra por su observación de que se desarrolla más 
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fácilmente con un impulso bajo. Por ejemplo, los promedios de tres 
series de respuestas sucesivas a un silbido más el transcurso del tiempo 
diferían cuando el reflejo era débil y fuerte como viene indicado en la 
tabla siguiente (unidad de tiempo = 30 segundos): 


S+: ti bt ta ts to 
Fuerte 0... 0 0 0 2/3 2 1/3 5 2/3 
Débil 00.00... 1 4 1/3 8 3 1/3 4 1/3 5 2/3 


Un estímulo dado Stn o S + ta puede constituir no sólo el único fac- 
tor de una discriminación, sino un componente de la misma. Vamos a 
poner un ejemplo de un componente que excluya el tiempo. Correla- 
cionemos un reforzamiento con SaSb, pero no con SaSbSc o SaSc. En- 
tonces, en presencia de SaSb el organismo responderá, pero si se aña- 
de Sc, no responderá. Ahora bien, en tal caso, Sc puede sustituirse por 
Sta 0 S + tn. Pavlov describe un experimento de este tipo en que Sa 
era la estimulación general de la situación experimental, Sb el sonido 
de un metrónomo y Sc el sonido de una bocina. SaSb fue reforzado, 
pero SaSbSc + ta no lo fue. Como consecuencia de ello, podía obtenerse 
una respuesta con la presentación del metrónomo con tal que la bocina 
no hubiera sonado precisamente a un cierto intervalo. En un experimen- 
to similar que consistía en la combinación del sonido de un metrónomo 
y de otro estímulo S + ta, en que S era la alimentación periódica tal 
como se ha descrito en el párrafo anterior, un perro llegó a responder 
al metrónomo cuando éste se ponía en marcha al trigésimo minuto, 
pero no al quinto o al octavo. A diferencia del caso anteriormente des- 
crito, este experimento muestra la inducción esperada de S + tw a los 
puntos precedentes del continuo; después de más de ocho minutos el 
metrónomo produjo un efecto que se incrementó a medida que aumen- 
taba la duración del tiempo. 

En los reflejos “retardados” y “de huella” estamos tratando con 
discriminaciones, y no nos debe sorprender el hecho de encontrar de 
nuevo el concepto de “inhibición” utilizado como explicación. En este 
caso la supresión de la actividad durante el intervalo entre Só to y SP ta 
se considera como la “inhibición de retraso”. El efecto puede formularse 
sin esta noción, como indican los párrafos precedentes, y una vez más 
existen razones lógicas y prácticas para prescindir de ella. Los datos 
en favor de la “desinhibición” durante el retraso son por lo general 
más convincentes que aquellos en favor de la misma durante la extin- 
ción o las discriminaciones no-temporales, pero vamos a sugerir aquí 
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otras explicaciones alternativas, En un experimento típico, Pavlov cita 
la “desinhibición” del retraso a un estímulo táctil ocasionada por un 
metrónomo en los términos siguientes (unidades de treinta segundos): 


S: to ti ta ta ty ts Total 
TAL coto ión 0 0 9 6 13 16 783 
Táctil + metrónomo ............ 4 7 7 3 5 9 385 


Las cifras de la estimulación táctil sola corresponden a los promedios 
de cuatro series. Como podemos ver, en presencia del metrónomo no se 
produce ningún retraso significativo. Una explicación posible es la efi- 
cacia discriminativa muy ligera de una diferencia de tiempo que, en 
vista de la progresividad con que se presenta SP, debería facilitar la ope- 
ración de los factores ya propuestos en cuanto productores del efecto 
de la “desinhibición”. Una posibilidad especial es la de la superposición 
inductiva entre la presentación del estímulo “desinhibidor” y la pre- 
sentación de comida, que está de acuerdo con el hecho de que la secre- 
ción total es aproximadamente la misma en los dos casos, indicando por 
tanto la existencia de una reserva única. 


En ningún punto de la formulación anterior el “tiempo” o un “inter- 
valo de tiempo” llegan a adquirir rango de estímulo. El tiempo aparece 
como la propiedad única de la duración, comparable con la intensidad, la 
longitud de onda, etc. Como ya he advertido, la aparición de una pro- 
piedad singular en la posición de un estímulo constituye, en cierto modo, 
un signo de que el reflejo no es más que un pseudorreflejo, esto es, que 
el estímulo es discriminativo y no provocador. En el presente caso hay 
una discriminación entre el punto St, y los puntos adyacentes Stp— 1 
O Stn + 1 situados sobre un continuo temporal, de la misma forma que 
en otro caso puede haber una discriminación entre una longitud de onda 
determinada y las longitudes de onda adyacentes a ella. La discrimina- 
ción surge porque el reforzamiento está correlacionado cori un estímulo 
que posee este valor único de la propiedad, pero la respuesta no está 
correlacionada con la sola propiedad aislada. No podemos concebir S: 
10 segundos . R como un verdadero reflejo. Al igual que en el caso de 
S: longitud de onda de 550 mu. R, la expresión es incompleta. Por esta 
razón no constituye un uso riguroso del término designar los casos ante- 
riores como reflejos “retardados” o “de huella”. En la extensión de esta 
formulación del tiempo a la cuestión más general del conocimiento hu- 
mano, es importante hacer esta distinción. El tiempo se considera gene- 


284 


ralmente como un estímulo, Por ejemplo, Pavlov dice que “la duración 
del tiempo ha adquirido las propiedades de un estímulo condicionado” 
(pág. 40) y habla de “los intervalos de tiempo en su calidad de estímulos 
condicionados” (pág. 41). Pero el tiempo carece de las dimensiones apro- 
piadas de un estímulo. Considerarlo de esta forma simple e inexacta su- 
pone levantar una fuerte barrera que impide la comprensión del papel 
que el tiempo juega en la naturaleza y en nuestro conocimiento de la 
naturaleza. 

La insistencia sobre la distinción entre reflejos y pseudorreflejos, 
a mi juicio, no es ninguna sutileza. Es útil para la obtención de cierto 
grado de orden y regularidad en la ciencia de la conducta. Por ejemplo, 
las leyes de la latencia, del umbral, de la postdescarga, etc., están des- 
tinadas a aplicarse a los reflejos de forma general, pero si nos permitimos 
considerar S: intervalo de tiempo . R como un reflejo sin cualificación, 
pierden su sentido al aplicarlas a dicha entidad. No sólo hemos pasado 
por alto gran parte del proceso del establecimiento de dicha relación, 
sino que nos hallamos ante una entidad que tiene propiedades insólitas 
y que se comporta de forma anómala. 


La descriminación temporal tipo R 


Los ejemplos anteriores sobre la discriminación temporal se refieren 
a los reflejos condicionados tipo S. El mismo principio de dividir un con- 
tinuo temporal en partes distinguibles mediante la correlación de un 
acontecimiento externo se aplica al tipo R, aunque se plantea una difi- 
cultad técnica especial. En el tipo S es fácil de individualizar cualquier 
punto de un continuo temporal (cualquier momento durante la presen- 
tación continua de un estímulo) para correlacionarlo con un estímulo re- 
forzante, porque este último se controla arbitrariamente. En el tipo R 
el reforzamiento es contingente a la ocurrencia de la respuesta y no hay 
una forma cierta de obtener una respuesta en un momento dado durante 
la presentación de un estímulo discriminativo. La correlación entre al- 
gún punto del continuo y el reforzamiento puede establecerse simple- 
mente y se puede permitir al organismo que responda libremente. Así, el 
reforzamiento de la respuesta a la palanca podría ser condicional a su 
ocurrencia entre los 15 y 20 segundos posteriores a la presentación de 
la luz. Si se ha establecido previamente una discriminación simultánea, 
todas las respuestas a S2 to ... ti5 no serán reforzadas y desaparecerán, 
mientras que las respuestas a SD fis ... tao serán reforzadas y se manten- 
drán. Si no se ha establecido previamente ninguna discriminación, ésta 
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surgirá, probablemente, a través de la inducción de Stis ... tzo sobre Sto ... 
tis que prescindirá del factor temporal, pero la conducta al fin se irá 
reduciendo a medida que progrese la discriminación temporal. 

No he diseñado experimentos especiales para ilustrar este problema, 
pero la conducta de la rata durante condicionamiento periódico (capí- 
tulo 4, implica dos discriminaciones temporales tipo R. En el primer 
caso, que llamaremos Discriminación temporal a partir del reforzamiento 
anterior, el estímulo discriminativo es la estimulación compleja que surge 
de la presentación de un gránulo de comida y su ingestión más el trans- 
curso del tiempo y, por consiguiente, es del mismo tipo que el “reflejo 
de huella” de Pavlov. Si dividimos el intervalo usual de cinco minutos 
en diez partes de treinta segundos cada una, podemos decir que todas 
las ocurrencias de sS + to... to. R no se refuerzan, mientras que ciertas 
Ocurrencias de S + tio. R sí se refuerzan. De los resultados que dimos 
en el capítulo 4 se desprende claramente que se desarrolla una discri- 
minación temporal. La primera prueba de ello es el aplanamiento de 
las primeras curvas de extinción después de los reforzamientos periódi- 
cos. Debido al procedimiento periódico, sS + to. R se debilita y sS 
+ ta. K se fortalece, mientras que los reflejos intermedios se ven afec- 
tados en la medida de su proximidad a esos extremos. Cuando el in- 
tervalo entre los reforzamientos no es demasiado grande (pongamos, por 
ejemplo, tres minutos), la fuerza del reflejo inmediatamente después del 
reforzamiento puede alcanzar el valor de cero, en cuyo caso la discri- 
minación produce el tercer orden de desviación descrito en el capítulo 4. 

La acción de la recepción y de la ingestión de comida como estímulo 
discriminativo puede ser demostrada, aun cuando la discriminación no 
esté muy avanzada, reforzando el reflejo a intervalos de dos y de ocho 
minutos, en lugar de cinco y cinco minutos. La pendiente de la curva 
no se ve seriamente afectada, pero el efecto discriminativo local de los 
reforzamientos adyacentes viene claramente indicado por el hecho de 
que la curva resultante es de carácter ondulado en vez de lineal. La 
figura 88 (pág. 287) es de este tipo. Los reforzaminetos adyacentes van 
acompañados por una depresión de asa, que es debida a la sumación 
de sus funciones discriminativas. Ya se recordará que, como vimos en 
el capítulo 4, cuando los reforzamientos se espacian de forma regular, 
la tasa es aproximadamente constante durante la hora. 

El mantenimiento de una razón de extinción constante durante el 
reforzamiento periódico puede parecer que va en contra de esta inter- 
pretación. Si se establece una discriminación entre S + fa y S + in—x, 
¿por qué la tasa de respuesta no desciende como lo hace durante la 
discriminación típica descrita en el capítulo 5? En otras palabras, ¿por 
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qué la rata no aprende simplemente a esperar hasta el momento del 
reforzamiento? Podemos dar varias respuestas. En primer lugar, la di- 
ferencia discriminativa entre la “luz encendida” y la “luz apagada” es 
mayor que la existente entre dos puntos del continuo temporal incluso 
remotos, Es muy posible que aunque se establezca una discriminación 
temporal en el sentido de que se produzca una separación de fuerza 
entre s$ + ta.R y sS + ta —x.R, la caída inductiva puede ser escasa 
o nula. Entonces la ley de la reserva Operante debiera cumplirse y el 


RESPUESTAS 


.MIEMPO EN HORAS 


FicuraA 839 
REGISTRO ONDULADO OBTENIDO AGRUPANDO REFORZAMIENTOS SUCESIVOS 


Se reforzaron las respuestas, alternativamente, a intervalos de dos y ocho minutos. 
El efecto discriminativo de la ingestión del gránulo es aditivo 


reforzamiento periódico de sS + ta. R debiera dar una razón de extin- 
ción constante aunque la mayor parte de las ocurrencias de la respuesta 
en realidad tengan lugar en presencia de sS + ta —«. El ligero descenso 
de tasa observado durante los veinticuatro días de la figura 29 puede 
mostrar una caída de la inducción proporcionada a las propiedades in- 
ductivas del continuo. Pero no hay necesidad de recurrir a la pequeñez 
de la diferencia discriminativa. Aunque está claro que la rata discrimi- 
na entre S + tio y S + ti, de manera que responde en presencia del 
primero, pero no en presencia del segundo, no discrimina entre S + to 
y S + ts. Pero las respuestas en presencia de S + to no son reforzadas. 
Hay una diferencia esencial entre una discriminación en la que el 
cambio de S% a SD es gradual y una discriminación en que es brusco. 
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Un experimento comparable en el que un estímulo como una luz ocu- 
para el lugar del transcurso del tiempo (o, mejor dicho, lo complemen- 
tara) requeriría que la luz incrementara lentamente su intensidad desde 
cero, inmediatamente después del reforzamiento, hasta un valor máxi- 
mo al final del intervalo. Asimismo, se podría obtener un caso paralelo 
más tosco en el que se apagara y se encendiera alternativamente una 
luz durante períodos de dos y tres minutos, respectivamente, y la res- 
puesta fuera reforzada una vez en cada uno de los períodos de tres 
minutos. En tal caso debiera establecerse una discriminación entre 
SI y SA, pero tendría que mantenerse la razón de extinción durante el 
período de Sl. Esto es esencialmente lo que tiene lugar durante una 
discriminación temporal de este tipo. La rata discrimina entre las gamas 
S+to...txy S + tx... ta, pero sus respuestas en presencia de S + tx 
... En, sólo son reforzadas periódicamente. Esta característica parece ine- 
vitable en una discriminación temporal porque SP, desde luego, no 
puede presentarse más que gradualmente. 


Esta interpretación de la tasa bajo recondicionamiento periódico 
guarda una relación con la curva de extinción subsiguiente, sobre la 
que es conveniente, en este momento, llamar la atención. Podría argilir- 
se que la curva de extinción obtenida después de recondicionamiento 
periódico tiene propiedades peculiares (particularmente, la gran área 
que encierra), no debido a la creación de uma reserva mayor, como he 
sostenido en el capítulo 4, sino a causa de una discriminación temporal. 
En contraste con su conducta en la extinción original, la rata puede 
seguir apretando la palanca porque previamente un período de no- 
reforzamiento fue seguido por reforzamiento. Esta objeción es válida 
dentro de ciertos límites. La curva de extinción obtenida después de 
recondicionamiento periódico corresponde a sS +ta ... n+x.R. De 
ello se desprenden varias consecuencias. En primer lugar, no debe con- 
siderarse que empieza la curva de extinción hasta que se omite el pri- 
mer reforzamiento, con objeto de prescindir de las pocas respuestas a 
S + to ... tn que quedarían incluidas en ella si se midiera la curva desde 
el último reforzamiento. Esta condición se observó en el capítulo 4 cuan- 
do las curvas se iniciaron en un nuevo día y también (como en la figu- 
ra 36 B) cuando se interrumpió repentinamente el reforzamiento. Una 
segunda consecuencia es que la curva de extinción puede empezar a 
una tasa superior que la imperante bajo recondicionamiento periódico, 
como en la figura 38 del capítulo 4. Esto es acorde con el hecho de que 
la curva corresponde a sS + ta ... R. La curva de discriminación no 
debiera mostrar un incremento comparable porque la rata recibe aún 
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la estimulación periódica causada por la ingestión de la comida. Si 
comparamos la figura 38 con la figura 54 vemos que esto es lo que real- 
mente sucede. Una tercera consecuencia es que la componente discri- 
minativa sigue cambiando a medida que transcurre el tiempo, pero de 
acuerdo con la ley de la reserva operante debe obtenerse el mismo nú- 
mero de respuestas. Por lo tanto, la altura de la curva no se ve afectada 
y su forma muy probablemente no se ve modificada de forma signi- 
ficativa. 


El procedimiento del recondicionamiento periódico constituye, asi- 
mismo, la base de otro tipo de discriminación temporal. Hay dos clases 
de acontecimientos que tienen lugar durante este experimento: 1) re- 
forzamientos periódicos; 2) la ocurrencia de respuestas no reforzadas. 
La discriminación temporal que acabamos de considerar estaba basada 
en el primero de estos procedimientos, pero el segundo es también 
posible. A causa de la razón de extinción y de la ocurrencia de un nú- 
mero aproximadamente constante de provocaciones entre reforzamien- 
tos, existe una relación entre el reforzamiento y la conducta anterior 
de la rata. Esto puede expresarse en términos de la tasa anterior o, 
mejor aún, del intervalo de inactividad inmediatamente anterior a la 
respuesta reforzada. Podemos llamar a esta segunda discriminación 
la discriminación temporal a partir de la respuesta anterior. 

Si la rata está respondiendo a una tasa altamente constante, la 
respuesta reforzada siempre vendrá precedida por un intervalo cons- 
tante de no-respuesta. Por ejemplo, si la razón de extinción es de 20:1 
y el intervalo de cinco minutos, las respuestas se producen a la tasa 
de cuatro por minuto y cada respuesta reforzada viene precedida por 
un período inactivo de quince segundos. Ahora bien, si se produce al- 
guna variación local en la tasa, es más probable que una respuesta 
reforzada vaya precedida por un período de inactividad más largo. Esto 
se deduce directamente del hecho que el establecimiento de la cone- 
xión entre la respuesta y el reforzamiento es plenamente independiente 
de la conducta. En la figura 84 presentamos un caso esquemático. Si 
la tasa es constante, existe sólo una posibilidad, que se mantiene a lo 
largo del experimento, tal como muestra la barra horizontal sombreada 
de la línea A. El establecimiento de la conexión entre el reforzamiento 
y la respuesta en cualquier momento del período significa simplemente 
que la próxima respuesta será reforzada y que habrá seguido a la res- 
puesta anterior a un intervalo constante. Por otra parte, si la tasa pre- 
senta variaciones locales, necesariamente tiene que haber espacios llenos 
y vacíos como muestra esquemáticamente la línea B, y la tendencia 
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hacia la agrupación significa que una respuesta reforzada seguirá más 
frecuentemente a un intervalo relativamente largo. En el caso particu- 
lar representado en la línea B, el establecimiento de la conexión entre 
la respuesta y un reforzamiento ocasionará una respuesta reforzada des- 
pués de un breve intervalo durante sólo un tercio del tiempo (indicado 
por las barras negras). Durante los dos tercios del tiempo (barras blan- 
cas) la conexión produce una respuesta reforzada después de un inter- 
valo cuatro veces mayor. A través de una discriminación temporal, el 
resultado de este cambio consiste en fortalecer la respuesta después de 
largos períodos de inactividad y en debilitarla después de intervalos 


Ao 060 06 9 6 O 0 Oe e. e 


FicurA 84 


Los puntos representan las respuestas que ocwren en el tiempo, de izquierda 
a derecha 


cortos. El efecto reside en una estabilización de la tasa a un valor aproxi- 
damente constante, que viene determinado por la razón de extinción. 

El segundo tipo de discriminación temporal contribuye probable- 
mente al aplanamiento de las sucesivas pequeñas curvas de extinción 
cuando se inicia el reforzamiento periódico por primera vez, especial- 
mente en las frecuencias de reforzamiento más bajas. Los reforzamien- 
tos tienden a ocurrir cuando la rata está respondiendo de forma relati- 
vamente lenta hacia el fin de cada curva y, por consiguiente, la rápida 
respuesta del principio se ve debilitada. La discriminación opera aquí 
en colaboración con la basada en el reforzamiento anterior. Es decir, 
la rata deja de responder rápidamente poco después de cada reforza- 
miento porque: 

1) Las respuestas después del reforzamiento nunca son reforzadas. 

2) Las respuestas que siguen de cerca a otras respuestas raras ve- 
ces son reforzadas. La segunda discriminación es probablemente la 
única responsable del mantenimiento prolongado de una tasa constante 
durante el recondicionamiento periódico. La linealidad de las curvas 
no puede deberse a la discriminación basada en el reforzamiento ante- 
rior, pues en tal caso sería el resultado accidental de una etapa deter- 


290 


minada del desarrollo de la discriminación. Su mantenimiento continuo 
como tal es altamente improbable. La discriminación basada en la 
respuesta anterior, sin embargo, produce una tasa constante como efec- 
to último y estable. 

Constituye una simplificación burda considerar que esta segunda 
clase de discriminación se basa sólo en una sola respuesta anterior no 
reforzada. Debemos suponer que otras respuestas antecedentes contri- 
buyen también a ella, aunque de forma menos importante. Si se puede 
decir que el efecto de una respuesta no reforzada es “posponer” una 
respuesta posterior, cuando por alguna razón una respuesta ocurre de- 
masiado pronto, se produce un efecto sumado hacia la posposición. 


0 


FiGuRA 85 


Los puntos representan las respuestas que ocurren en el tiempo, de izquierda 
a derecha 


Así, en la figura 85 el intervalo más largo en la línea B se debe a una 
agrupación (incidental) de las dos respuestas anteriores. Si por alguna 
razón una respuesta ocurre demasido tarde, se produce una reducción 
en la acción normal posponente y la respuesta siguiente debe ocurrir 
más pronto, como en la línea C. La discriminación se basa sobre todas 
las respuestas anteriores (con una influencia cada vez menor a medida 
que el intervalo aumenta), pero para el presente problema su efecto, en 
cuanto produce y mantiene una tasa constante, es cualitativamente el mis- 
mo que si sólo la respuesta anterior fuera efectiva. La figura 85 muestra 
un tipo de compensación que es semejante bajo muchos aspectos al del 
mecanismo responsable de la tasa de respuesta en ausencia de una dis- 
criminación, compensación que ya estudiamos en el capítulo 4. La 
distinción, a mi juicio, es suficientemente clara y la evidencia de una 
relación discriminativa como factor de control durante el recondicio- 
namiento periódico es bastante convincente. 

La discriminación que es responsable de la tasa más o menos cons- 
tante observada durante el recondicionamiento periódico es muy co- 
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rriente fuera del laboratorio. En el hombre se desarrollaría una discri- 
minación mucho más rápida a partir del reforzamiento anterior. Con 
un intervalo de cinco minutos, generalmente aparecería pronto un pe- 
ríodo de inactividad de al menos dos o tres minutos. Pero durante la 
última parte del período esta discriminación sería ineficaz (es decir, no 
existiría ningún “indicio en cuanto a si sería el momento oportuno para 
Ocurrir O no un reforzamiento”) y se produciría una respuesta repetitiva 
similar. En términos vulgares podríamos decir que una persona hace 
una pueba ocasional con la palanca. La tasa según la cual se produce 
la prueba dependerá, como en el caso de la rata, del impulso (ver capí- 
tulo 10), de la frecuencia con que se ha producido el reforzamien- 
to en el pasado, etc. También podemos decir, corrientemente, que la 
persona se percata de que el reforzamiento está en función del tiempo, 
que sabe que no tiene más que esperar el tiempo suficiente para que 
la respuesta sea efectiva, y que habiendo apretado la palanca una vez 
sin éxito, pronto tiene la impresión de que ya es hora de probar de 
nuevo. La última parte de esta formulación se aplica a la discrimina- 
ción que estamos estudiando ahora, aunque la terminología vaya más 
allá de los hechos observados. 


Reforzamiento a una razón fija 


Aunque el momento en que ocurre una respuesta dada bajo el pro- 
cedimiento de reforzamiento periódico es determinado, en definitiva, 
por una discriminación, en el capítulo 4 mostramos que el número 
total de respuestas estaba en función del reforzamiento, Esta función, 
o la noción de la razón de extinción, no implica la distribución de las 
respuesta separadas. Pero la existencia de una razón definida, cuando 
se considera un poco más ampliamente, plantea un interesante proble- 
ma, parte de cuya solución radica en la naturaleza de la discriminación 
temporal que acabo de describir. Supongamos, por ejemplo, que la ra- 
zón de extinción de un reflejo dado es de 20:1. ¿Significa esto que el 
organismo es incapaz de sobrevivir en una situación experimental en 
que pueda obtenerse un gránulo de comida cada vez que se apriete 
la palanca, por ejemplo, veinticinco veces? Según la noción de la razón 
de extinción tendría que ser así, pues la recepción de un gránulo de 
comida cada veinticinco respuestas no debiera mantener la reserva del 
reflejo y, por lo tanto, su fuerza debería descender hasta cero. Pero este 
resultado parece improbable. Se presenta una solución en términos de 
la variación de la razón de extinción con el impulso. Pero aunque la 
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razón aumente a medida que el organismo esté cada vez más ham- 
briento, como mostraremos en el capítulo 10, no se alcanzaría un 
valor que beneficiara a la rata si se hiciera depender el reforzamiento 
de la emisión de cien respuestas, pongamos por caso. Una solución sa- 
tisfactoria requiere el análisis de la conducta de la rata cuando la razón 
entre las respuestas reforzadas y las no reforzadas no es el resultado 
de la tasa de respuesta a una periodicidad dada de reforzamiento, sino 
que está fijada exteriormente. 

Cuando se ha averiguado la razón de extinción a un impulso dado, 
pueden darse tres casos si cambiamos el programa de reforzamiento 
de recondicionamiento periódico por el de recondicionamiento a una 
razón fija. La razón fija puede determinarse a un valor menor (caso 1), 
mayor (caso 2) o igual (caso 3) al de la razón de extinción. En cada 
caso, el primer efecto sobre el organismo es predecible a partir de la 
relación previamente demostrada existente entre la tasa de respuesta 
y la frecuencia de reforzamiento. Estos cambios no afectan a la dis- 
criminación temporal que vamos a considerar, pero voy a tratarlos 
primero. Ultilizando un grupo de ocho ratas hemos obtenido varios 
ejemplos experimentales de esos tres casos. Las razones de extinción 
se determinaron primero durante recondicionamiento periódico a inter- 
valos de cinco minutos, y luego el recondicionamiento se efectuó a ra- 
zones fijas menores, mayores o iguales a los valores así obtenidos. Con 
el grado de impulso usado en estos experimentos el grupo dio razones 
de extinción relativamente bajas, que eran las más apropiadas para 
destacar el tipo principal de cambio que tenía lugar. 


Caso 1. Razón fija < razón de extinción. Si una rata ha estado 
respondiendo a una tasa de diez respuestas por intervalo entre refor- 
zamientos, pongamos por caso, y si la razón se fija entonces a ocho, 
por ejemplo, es evidente que la frecuencia del reforzamiento aumen- 
tará. Si la respuesta se ha reforzado cada cinco minutos, ahora será 
reforzada cada cuatro. Pero ya que la razón de extinción sigue siendo 
constante, un aumento de la frecuencia de reforzamiento debe ocasio- 
nar un aumento de la tasa de respuesta. Esto significa que la frecuencia 
de reforzamiento, a su vez, se incrementará aún más y así sucesiva- 
mente. Finalmente, se alcanzará una tasa de respuesta límite. 

Si suponemos que el pleno efecto del reforzamiento prematuro en 
el primer intervalo (cuando ocurre a los cuatro en vez de a los cinco 
minutos) se experimenta como un aumento inmediato de la tasa de 
respuesta, los registros obtenidos deben tener el carácter indicado en la 
figura 86. En esas curvas teóricas se ha presumido una razón de 
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extinción de 10:1, con la cual un período de cinco minutos debería 
dar la línea recta representada en la figura. Los resultados esperados 
de los cambios a razones fijas de 4:1, 6:1, 8:1 y 9:1 se han indicado 
con las curvas de dicha figura. Así, a una razón fija de 6:1 el segundo 
reforzamiento se obtiene en tres minutos en lugar de cinco. Entonces, 
la tasa de respuesta aumenta y se obtiene un segundo gránulo a los 
1 4/5 minutos. La tasa se incrementa de nuevo y el tercer gránulo se ob- 
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Ficura 86 


ACELERACIONES CALCULADAS A PARTIR DE DIVERSAS RAZONES FIJAS MENORES 
QUE La RAZÓN DE EXTINCIÓN (PRESUMIENDO QUE ÉSTA ES DE 10:1) 


tiene a los 1 3/25 minutos y así sucesivamente. La pendiente constante en 
la que se detiene la aceleración se ha determinado arbitrariamente a 
treinta respuestas por minuto, concediendo diez segundos para la inges- 
tión de cada gránulo. La pendiente final es inferior con las razones fijas 
más bajas porque la ingestión de comida requiere una parte mayor 
del tiempo. 

El supuesto de que un reforzamiento prematuro surte un efec- 
to inmediato no puede aceptarse plenamente. En el capítulo 4 ya 
mostramos que un cambio de las condiciones del reforzamiento no ori- 
gina inmeditamente un cambio de una tasa a otra. Cuando se reduce 
la frecuencia del reforzamiento (o cualquier otro factor que controle la 
cantidad total del reforzamiento), la tasa de respuesta no desciende 


294 


a un nuevo nivel de inmediato. En el caso límite del cambio a una 
frecuencia de reforzamiento cero se obtiene la curva de extinción típica. 
Cuando se adopta una frecuencia intermedia, la tasa de respuesta cam- 
bia siguiendo una curva de extinción. En la figura 34 se muestra un 
efecto comparable observado durante cualquier aumento de la canti- 
dada total de reforzamiento. Por consiguiente, no cabe esperar curvas 
experimentales exactamente comparables a las curvas de la figura 86, 
pero pueden acercárseles tanto que debe suponerse que el desfase del 
efecto de la frecuencia de reforzamiento automáticamente creciente es 
muy ligero. La figura 87 muestra una curva experimental representa- 


RESPUESTAS 


1 HORA 


TIEMPO 


Ficura 87 


ACELERACIÓN A PARTIR DE UNA RAZÓN FIJA LIGERAMENTE MENOR QUE LA RAZÓN 
DE EXTINCIÓN 


La razón de extinción está calculada a partir de la curva A que se registró con 
un reforzamiento periódico de cinco minutos 


tiva. El registro de A corresponde a un recondicionamiento periódico 
a intervalos de cinco minutos. La razón de extinción correspondien- 
te a esta hora fue de 4 1/6:1. Determinaciones previas de la razón de 
esta rata dieron un promedio ligeramente superior a 5:1. Los registros 
de B corresponden a los dos días siguientes, cuando se reforzó la res- 
puesta a la razón fija de 4:1. El primero de estos días la tasa sobre- 
pasó ligera pero no excesivamente el promedio de la rata. Durante la 
hora ésta recibió dieciocho reforzamientos. Al día siguiente empezó a 
notarse una aceleración y se alcanzó una tasa máxima constante antes 
del final de la hora. La curva es muy semejante a la calculada en la 
figura 86 para una razón fija igual al 80% de la razón de extinción. El 
hecho de que no se obtuviera la aceleración el primer día pudo deber- 
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probar la presente interpretación describiendo curvas de este tipo con 
una ecuación. Se obtienen de forma casi invariable curvas de suavidad 
comparable cuando la línea-base es comparablemente uniforme. 


RESPUESTAS 


TIEMPO EN MINUTOS 
Ficura 88 9 


RÁPIDA ACELERACIÓN A PARTIR DE UNA RAZÓN FIJA DE APROXIMADAMENTE LA MITAD: 
DE LA RAZÓN DE EXTINCIÓN 


En el caso presentado en la figura 87 la razón fija no era inferior 
al 80% de la razón de extinción. Cuando aquélla es relativamente más 
baja, puede observarse una aceleración más rápida. En la figura 88 la 
Primera curva corresponde a un recondicionamiento periódico a inter- 
valos de cinco minutos. La segunda curva, registrada al día siguiente, 
muestra el efecto del cambio a una razón fija aproximadamente igual a 
la mitad de la razón de extinción. Aquí la aceleración hasta una pen- 
diente máxima es muy rápida y corresponde al caso de la figura 86 
cuya razón es de 4: 1. 
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Cuando las dos razones se aproximan, una discriminación temporal 
que describiremos más adelante entra en juego para modificar el re- 
sultado, de tal forma que no se obtienen curvas que presentan una 
lenta aceleración semejante a la de una razón de 9:1 como en la figu- 
ra 96. 


Caso 2. Razón fija > razón de extinción. Cuando la razón fija exce- 
de a la razón de extinción de forma tal que puede decirse que, al com- 
parar el input y el output de cada reforzamiento, la rata “sufre pér- 
didas”, el resultado depende del grado de exceso. Si la razón fija es 
muy elevada, la respuesta puede extinguirse plenamente antes de que 
se logre un segundo reforzamiento. Aun cuando ocasionalmente la rata 
reciba un reforzamiento, el efecto recondicionante del mismo puede 
que no sea suficiente para mantener una tasa de respuesta determina- 
da y, por lo tanto, la respuesta desaparecerá en virtud de la extinción. 
De este modo es posible que una rata muera de inanición aun cuando 
podría disponer de un suministro de comida si pudiera mantenerse la 
fuerza del reflejo. Si la razón fija sólo excede ligeramente la razón de 
extinción, al principio la tasa de reforzamiento se reduce y la tasa de res- 
puesta puede descender, pero si la extinción no es demasiado rápida, 
puede entrar en juego el efecto discriminativo que describiremos más 
adelante. 

Cuando una razón fija menor que la razón de extinción ha originado 
una tasa máxima de respuesta como en la figura 87, el cambio repentino 
a una razón mayor puede extinguir el reflejo, más o menos rápidamente 
de acuerdo con la magnitud de la nueva razón. La figura 89 presenta el 
registro del día siguiente a la serie de la figura 87, cuando se cambió re- 
pentinamente la razón fija de 4:1 a 12:1. La considerable irregularidad 
del registro es típica. El efecto final de extinción del reflejo queda mos- 
trado claramente. Este resultado puede obtenerse (como advertiremos 
más tarde) sólo cuando no se ha sostenido mucho tiempo la tasa máxi- 
ma, o, en otras palabras, cuando el efecto discriminativo que pronto va- 
mos a describir ha entrado en juego. 


Caso 3. Razón fija = razón de extinción. Si la tasa de respuesta es 
estrictamente uniforme, el reforzamiento de una respuesta cada m minu- 
tos es equivalente al reforzamiento de una cada n respuestas, sin es la 
razón de extinción. Parece no haber ninguna diferencia entre los dos 
programas, pero de hecho sus consecuencias son bien distintas. En el 
primer caso ningún cambio en la conducta de la rata mejorará su con- 
dición, pero en el segundo la rata sólo tiene que responder más rápi- 
damente para recibir un reforzamiento más frecuente. La cuestión es 
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si la rata puede “percibir la diferencia” o no y ajustar de acuerdo con 
ello su conducta y, en caso afirmativo, a través de qué procesos. Como 
a una tasa de respuesta constante no hay diferencia real de procedi- 
mientos, no cabe esperar ningún cambio de conducta, y con tasas de 
respuesta óptimamente uniformes a lo largo de breves períodos de tiem- 
po no se observa ninguno. Pero es difícil prolongar un experimento de 
este tipo por dos razones. 

En primer lugar, hay una ligera variación de la razón de extinción 
de un día a otro de manera que no puede lograrse una razón fija exac- 
tamente equivalente. Si un día determinado la rata está un poco más 
hambrienta que de costumbre, puede darse el caso 1; si está me- 
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RESPUESTAS 


TIEMPO (UNA HORA) 


Ficura 89 
EXTINCIÓN RESULTANTE A PARTIR DE UNA RAZÓN FIJA MUCHO MAYOR QUE LA RAZÓN 
DE EXTINCIÓN 


nos hambrienta, puede darse el caso 2. En segundo lugar, la tasa de res- 
puesta no es, de hecho, totalmente uniforme y, por ello, la discriminación 
ya mencionada puede entrar en juego. La discriminación permite a la 
rata aprovecharse de la razón fija y aumentar la tasa de administración 
de comida. 


Esta nueva discriminación es importante, especialmente con respec- 
to al concepto de la reserva del reflejo. Surge debido a que un progra- 
ma de reforzamiento basado en la ejecución de una serie de respuestas 
tiene propiedades que lo distinguen del programa responsable de la 
segunda discriminación temporal descrita anteriormente. La diferencia 
esencial consiste en que un reforzamiento basado en la ejecución de 
un número determinado de respuestas no reforzadas (es decir, según una 
razón fija) favorece el reforzamiento de las respuestas que siguen a in- 
tervalos relativamente breves en vez de largos como en el caso del re- 
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forzamiento periódico simple. Así, en el caso particular representado 
en la figura 84, línea B, cuando el reforzamiento se proporciona según 
un programa temporal, existe una posibilidad de que una respuesta re- 
forzada siga a un intervalo de media unidad contra dos posibilidades 
de que siga a un intervalo de dos unidades. Bajo el reforzamiento según 
una razón fija, en el mismo caso, hay dos posibilidades de que una res- 
puesta reforzada siga a un intervalo de media unidad y sólo una posi- 
bilidad de que siga a un intervalo de dos unidades. No conocemos la 
relación existente entre la magnitud del efecto discriminativo de una 
respuesta anterior y el tiempo transcurrido después, pero su efecto so- 
bre la conducta está claro. Dicho efecto consiste en producir una dis- 
criminación en el sentido del incremento de la tasa de respuesta. En 
virtud de la irregularidad de su respuesta, la rata puede hacer esta discri- 
minación y así adaptarse eficazmente a la razón fija. La rata puede 
notar la correlación del estímulo reforzante con la emisión de un nú- 
mero determinado de respuestas, distinguiendo así entre los dos pro- 
gramas de reforzamiento, debido únicamente a que su tasa de respuesta 
es variable. 

En la figura 90 reproducimos cuatro conjuntos de registros para 
mostrar el resultado del intento de nivelar razones fijas y de extin- 
ción. El primer día de cada conjunto muestra la tasa más o menos 
constante obtenida bajo reforzamiento periódico a intervalos de cinco 
minutos, a partir de la cual pudo calcularse la razón de extinción. En 
los días siguientes se adoptó una razón fija, en cada caso igual, en la 
medida de lo posible, a la razón de extinción así obtenida. La nivela- 
ción se logró en tres casos y originó el mantenimiento de aproximada- 
mente la misma tasa de respuesta al menos durante tres horas experi- 
mentales. En el cuarto caso, empezó una aceleración poco antes del 
fin de la primera hora a una razón fija, y aunque al día siguiente se 
dobló la razón en un intento de mantener baja la tasa, se mantuvo un 
valor máximo tal como viene indicado en la figura por medio de líneas 
discontinuas. Los otros registros muestran una irregularidad durante 
las tres horas experimentales, mayor que la que ocurre bajo recondi- 
cionamiento periódico normal, y las tres series, finalmente, se aceleran 
al tercer día. En la serie B podemos ver tres comienzos aparentes hacia 
una tasa máxima. La serie D mostró signos de extinción al cuarto día 
(tercer día a una razón fija) y, por lo tanto, la razón quedó disminuida 
ligeramente al día siguiente, cuando se produjo la aceleración final. 

En vista de la posibilidad de ligeros cambios en la razón de extin- 
ción de un día a otro, no es posible decir con certidumbre que esta ace- 
leración final no sea debida a una diferencia entre razones como la 
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que aparece en la figura 87, pero es probable que represente el desarro- 
llo de una discriminación para la que el procedimiento de reforzamien- 
to según una razón fija proporciona las condiciones necesarias. En 
todo caso, el presente resultado es que, ya sea a causa de las dificultades 
técnicas por mantener un impulso constante, o a causa del estableci- 
miento de una discriminación, la tasa constante prolongada durante 
el reforzamiento periódico no puede mantenerse mediante el reforza- 
miento a una razón fija. 
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RESPUESTAS 


PERÍODOS DIARIOS DE UNA HORA CADA UNO 


Ficura 90 


ACELERACIÓN FINAL CUANDO LA RAZÓN FIJA SE DETERMINA, EN LA MEDIDA 
DE LO POSIBLE, IGUAL A LA RAZÓN DE EXTINCIÓN 


El primer día se reforzó periódicamente la respuesta 


A pesar de esta nueva discriminación y del aumento de tasa resultan- 
te, hasta el momento presente no se ha excedido la razón de extinción. 
Cuando la razón fija se iguala con la razón de extinción, no se produce 
ningún cambio; cuando es menor, la contribución a la reserva del re- 
forzamiento periódico es mayor de lo que se precisa para mantener la 
tasa. Pero ahora se plantea un nuevo problema. Cuando la razón fija 
es mayor que la razón de extinción, la tasa puede también alcanzar un 
valor máximo como en los casos anteriores, aun cuando debiera pro- 
ducirse con cada reforzamiento una pérdida en favor de la reserva. 
Esto sucede si antes de que la extinción tenga lugar se brinda opor- 
tunidad para el desarrollo de la nueva discriminación temporal. La 
diferencia inicial entre la razón de extinción y la fija no debe ser demasia- 
do grande, pero pueden lograrse razones fijas de valores superiores 
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mediante etapas sucesivas. En los experimentos que ahora pasaremos a 
describir, unas ratas que mostraban una razón de extinción del valor 
usual de alrededor 20:1, con el mismo impulso alcanzaron una razón 
de 192: 1. En este caso, se percibe algo más que una discriminación. La 
rata realiza una adaptación vital gastando más respuestas de las que el 
recondicionamiento periódico está en condiciones de proporcionar, y 
su conducta a ese respecto podría parecer, a primera vista, que invalida 
toda la concepción de la razón de extinción y de la reserva. Pero es 
en este punto cuando la naturaleza especial del reforzamiento a una 
razón fija cobra importancia. 


Se diseñó un aparato especial que reforzaba automáticamente res- 
puestas a razones fijas. La palanca era semejante a la del aparato usual, 
pero el sistema de registro y de reforzamiento eran mecánicos, en vez 
de eléctricos, y completamente automáticos. El movimiento de la pa- 
lanca hacía girar un trinquete y producía la descarga de un gránulo a 
razones determinadas, por disposición de ciertos engranajes y ruedas 
dentadas. Era posible disponer razones de 16, 24, 82, 48, 64, 96 y 192 
respuestas por cada reforzamiento. Se utilizaron simultáneamente cua- 
tro de esos aparatos en una habitación insonorizada. Pero los aparatos 
no estaban insonorizados entre sí, ya que se sacrificó hasta cierto punto 
el grado de control a las necesidades prácticas. Para dar cabida a tasas 
considerablemente más altas se eligió un trazado más corto de la plu- 
milla, 


La mayor parte del experimento consistió en pruebas de una hora rea- 
lizadas con dos grupos de cuatro ratas cada uno durante cincuenta y cua- 
tro días consecutivos. El número total de respuestas registradas durante 
este período de tiempo fue superior a 887.000. Se condicionó a las ratas 
de la forma usual y durante tres días se estableció una razón de 16:1. 
Progresivamente se fueron estableciendo razones mayores hasta que se 
mantuvieron razones de 48:1 y más tarde de 64: 1. Hacia el duodécimo 
y decimotercer día seis ratas estaban dispuestas a pasar a razones de 
96:1 y 192:1. Entonces se siguió un programa según el cual cada rata 
se reforzaba por períodos de tres días a la misma razón, que podía ser 
de 48:1, de 96:1 o de 192: 1, siendo el orden elegido al azar. Dos de 
las ratas no lograron ajustarse a esas tasas más altas. Una sufrió la ex- 
tinción a una razón de 64:1, mientras que la otra logró con dificultad 
mantener esta razón y se extinguió a una razón superior. Estas excepcio- 
nes serán omitidas en la discusión siguiente. 


Como el aparato no permitía superar la razón de 192: 1, el experi- 
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mento no alcanzó el límite en el que puede mantenerse una razón fija. 
Sin embargo, quedó claramente demostrado que una razón de casi 200: 1 
era posible. Durante cada serie de tres días a ese valor no se pudo pro- 
bar que la respuesta estaba sufriendo extinción, aun cuando la razón de 
extinción bajo recondicionamiento periódico era del orden de 20: 1. Este 
es el hecho principal que me interesa aquí, hecho que requiere un aná- 
lisis cuidadoso si quiere conciliarse con la noción de una razón de ex- 
tinción constante a un impulso dado. 


Será conveniente empezar con un examen más detallado de la dis- 
criminación en virtud de la cual puede decirse que la rata “sabe que 
sólo tiene que apretar la palanca un cierto número de veces para recibir 
un reforzamiento”. La conducta de la rata durante una sola hora a una 
razón elevada muestra bastante claramente que en realidad se desarrolla 
una discriminación del tipo que cabe esperar de una razón fija. En la fi- 
gura 91 (pág. 303) presentamos los registros típicos de una rata con las 
tres razones principales, El aspecto significativo de cada registro es la 
relación existente entre la tasa en cualquier punto dado y la tasa inme- 
diatamente anterior, una relación que se obtiene durante el intervalo 
entre dos reforzamientos cualesquiera. El efecto es una serie de curvas 
cortas, convexas hacia abajo, en que los reforzamientos coinciden con 
los puntos de cambio brusco. Esta curvatura está de acuerdo con la no- 
ción de una discriminación temporal especial. 


La diferencia entre las discriminaciones bajo reforzamiento periódico 
y bajo reforzamiento a una razón fija puede formularse más rigurosamen- 
te de la forma siguiente: Cuando las respuestas que siguen a intervalos 
largos (es decir, que siguen a tasas bajas de respuesta) tienden a refor- 
zarse preferencialmente como en el caso del reforzamiento periódico, la 
respuesta aporta estimulación propioceptiva y exteroceptiva actuando 
como $”, pero la estimulación que empieza como S% + to y progresa ha- 
cia S% + ta pierde cada vez más potencia. El efecto de la respuesta con- 
siste en debilitar la operante; el efecto del transcurso del tiempo reside 
en fortalecerla, Por otra parte, cuando las respuestas que siguen a inter- 
valos cortos (esto es, a rápidas tasas de respuesta) son reforzadas prefe- 
rentemente, la estimulación a partir de una sola respuesta actúa como SD 
en lugar de como $4, pero la estimulación que empieza como SP + to 
y que se acerca a SD + fa se hace cada vez menos potente. Como esos dos 
estímulos discriminativos temporales se basan en una respuesta previa, 
pueden indicarse con las letras PR y la estimulación procedente de una 
respuesta puede representarse como S£, en el caso del reforzamiento 
periódico y como S?, en el del reforzamiento a una razón fija. 
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En ambos tipos de experimento, la discriminación a partir del re- 
forzamiento precedente es activa, pues un reforzamiento nunca ocurre 
inmediatamente después de otro. Por lo tanto, un reforzamiento actúa 
como S% en ambos casos. Su efecto puede escribirse S2, Como conse- 
cuencia de esta discriminación, la rata deja de responder durante un 
breve período de tiempo poco después de recibir y de ingerir un grá- 
nulo de comida. Pero bajo reforzamiento periódico S£, disminuye a 
medida que S;, disminuye y pronto se produce una respuesta: mien- 
tras que bajo reforzamiento a una razón fija S£, opera mientras S?, 
es máximo y deja de operar cuando S>, cesa. En el último caso la ope- 
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TIEMPO (CADA REGISTRO UNA HORA) 


Ficura 91 


REFORZAMIENTO A VARIAS RAZONES FIJAS 


Las razones vienen indicadas. Obsérvense las suaves aceleraciones entre los refor- 
zamientos (en las lineas horizontales) 


rante puede dejar de recuperarse a medida que aumenta la pausa des- 
pués de la ingestión, y si sólo se tomaran en cuenta estos dos factores 
no cabría esperar la prosecución de la respuesta. Pero aparte del debili- 
tamiento de Se, , otros factores tienden a fortalecer la operante durante 
la pausa, a saber, el restablecimiento de la reserva tras el esfuerzo rea- 
lizado, un hecho que vamos a discutir dentro de poco. Finalmente, se 
produce una respuesta. Esto fortalece inmediatamente a la operante 
al aportar S?, y pronto ocurre otra respuesta, que a su vez aumenta la 
fuerza. La tasa sigue acelerándose hasta que la rata recibe un reforza- 
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miento, adoptando la sección del registro la curvatura mostrada en la 
figura 91. 

Esas aceleraciones más o menos suaves constituyen probablemente 
ejemplos de lo que Hull (47) llama un “gradiente de meta”. Aunque 
la noción de meta no forma parte del presente esquema conceptual, 
su efecto reforzante puede reemplazarse por la simple noción de refor- 
zamiento. Un gradiente, asimismo, describe un cierto aspecto de la 
conducta, pero no es un concepto fundamental, pues puede surgir de 
la operación de muchos tipos distintos de factores. No tiene paralelo 
en el presente sistema, pero podemos fácilmente introducirlo en él 
si lo estimamos conveniente. En un caso descrito por Hull aparece 
un gradiente a causa de las diferencias progresivas en el efecto de un 
reforzamiento debidas a los períodos decrecientes que transcurren entre 
un reforzameinto y las etapas progresivas de un acto complejo, tal 
como las etapas sucesivas del acto de recorrer un laberinto. Esta serie 
de respuestas (por ejemplo, Mi, Ma, M3 . . .) deben ser bastante simi- 
lares si queremos comparar convenientemente sus fuerzas, pero asi- 
mismo deben hacerse en presencia de estímulos discriminativos distin- 
guibles para poder registrar el efecto diferencial del reforzamiento. En 
el caso presente, podemos comparar las operantes sS+to.R, sS+t1.R, 
sS+t2.R con las series M1, M2, M3, etc. Ambas constituyen una serie 
de respuestas en virtud de las cuales el organismo se aproxima a una 
“meta” o reforzamiento. En el caso presente las respuestas son idén- 
ticas y el único material diferenciador surge de la acumulación de 
S»,: El “gradiente” es debido al cambio del material discriminativo. 
(Podemos añadir, para complacer a aquellos que puedan sentirse preo- 
cupados por la sugerencia de una “causa final”, que no es la proxi- 
midad creciente a la “meta” lo que produce el aumento de tasa salvo 
en la medida en que la proximidad, bajo los términos del reforza- 
miento a una una razón fija, está en función de la distancia ya cubierta 
desde el reforzamiento precedente). 

Hay considerables diferencias individuales en el carácter de los 
“gradientes”. En un extremo, la pausa después de la ingestión puede 
ser relativamente grande y la aceleración subsiguiente hasta una tasa 
máxima o casi máxima puede ser muy rápida. El registro correspon- 
diente a una hora tiene forma escalonada con los ángulos bien defi- 
nidos. En el otro extremo, la pausa es breve, pero la tasa que le sigue 
inmediatamente es baja y se acelera lentamente. En este caso casi no 
hay rupturas horizontales y los escalones presentan una curvatura uni- 
forme. En la figura 92 damos ejemplos de esos casos extremos y de 
otros intermedios. Dadas tasas generales iguales (y por tanto presumi- 
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blemente reservas equivalentes), la diferencia puede expresarse en 
términos de la “fricción” de la primera respuesta. Si la respuesta se 
produce fácilmente, la discriminación basada en S£, aún es fuerte 
y la tasa disminuye. Si se produce tarde, la discriminación se debili- 
ta y el S”, de la respuesta es capaz de producir una rápida aceleración. 
La diferencia también puede deberse hasta cierto punto al estado de 
la reserva. 

El papel que juega la acumulación de S?, es evidente cuando por 
alguna razón se interrumpe momentáneamente la aceleración, como, 
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FicurRA 92 


VARIOS TIPOS DE “GRADIENTE” OBTENIDOS BAJO REFORZAMIENTO A UNA 
RAZÓN FIJA DE 192:1 


por ejemplo, por estimulación incidental (especialmente, en este expe- 
rimento, procedente de otros aparatos). Si la interrupción es lo sufi- 
ciente larga para reducir la acumulación de S?, considerablemente, se 
logra una tasa rápida sólo mediante una segunda aceleración. En la 
figura 93 indicamos varios ejemplos procedentes del mismo registro. 

Existe una relación entre la cantidad de SP añadida por una sola 
respuesta no reforzada y la razón de reforzamiento. Si la razón es baja, 
una respuesta añade una cantidad relativamente grande de SP; si es 
alta, una cantidad relativamente pequeña. Si el efecto total de un 
reforzamiento al establecer SP es constante, la propiedad discrimina- 
tiva adquirida por una respuesta sería ese efecto total dividido por el 
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número de respuestas que ocasionan el reforzamiento, aunque no se 
requiere necesariamente una distribución uniforme de cada respuesta, 
Por tanto podemos decir que la rata, no sólo desarrolla una discrimi- 
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GRADIENTES INTERRUMPIDOS BAJO UNA RAZÓN FIJA DE 192:1 


nación de tal suerte que uno de los efectos de la respuesta es una 
cantidad de SP, sino que la cantidad de SP es fija. A causa de la de- 
pendencia de la cantidad sobre la razón puede decirse que la rata 
distingue entre las razones de 48:1 y 96:1, pongamos por caso. 
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Los valores diferentes de SP aportados por una respuesta a razones 
distintas se evidenciaron en el presente experimento al cambiarse oca- 
sionalmente las razones. En la figura 94 damos cuatro registros típicos 
para mostrar la transición de una razón de 192:1 a 48:1. En cada caso 
se había reforzado la respuesta a una razón superior durante los tres 
días precedentes. La cantidad de SP aportado por una respuesta, por 
lo tanto, debiera de haber sido el 1/192 del efecto total de un refor- 
zamiento. Por consiguiente, cuando se cambia la razón a 48: 1, la curva 
empieza con una pendiente baja tras el reforzamiento inicial y se ace- 
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FicuraA 94 


REAJUSTE DE LA DISCRIMINACIÓN TEMPORAL AL DESCENDER A UNA RAZÓN 
FIJA MÁS PEQUEÑA 
La respuesta se había reforzado previamente, en cada caso, a una razón de 192:1 
durante tres días. En los días correspondientes a la figura se estableció la razón 48: 1 


lera sólo gradualmente a causa del efecto relativamente débil de cada 
respuesta, El segundo reforzamiento ocurre prematuramente (según el 
programa previo) cuando la rata todavía no ha alcanzado su punto 
máximo. El efecto de este reforzamiento ahora se ha distribuido a lo 
largo de 48 partes (en vez de 192) y, por lo tanto, la tendencia de 
toda la curva es hacia la aceleración. Después de tres o cuatro refor- 
zamientos a la nueva razón, ya se ha establecido el valor apropiado de 
SD por respuesta y en lo sucesivo toda la curva es lineal. 

En la figura 99 (de la página 316) damos un ejemplo del cambio 
de 192:1 a 16:1, y se percibe una tendencia similar, aunque no tan 
marcada, en otros cambios de razón. El cambio de uma razón baja a 
una alta produce el caso inverso en que la cantidad de SP empieza a 
un valor demasiado alto para el caso que estamos considerando. El 


307 


valor último a la tasa más elevada se alcanza a través de una curva 
de aceleración negativa. 


Ya advertimos antes que uno de los factores tendentes a anular el 
efecto de S?,, era el restablecimiento de la reserva tras el esfuerzo su- 
frido debido a la anterior ráfaga de respuestas. Ahora debemos exa- 
minar la relación de la reserva con la discriminación basada en S?, . La 
conducta de la rata bajo una razón fija no es independiente de la re- 
serva. La incapacidad de dos ratas para alcanzar razones de 64: 1 es una 
indicación suficiente de que puede alcanzarse un valor límite en que 
la respuesta sufra extinción a pesar de la nueva discriminación. Aun 
cuando se mantenga una elevada razón sin extinción, está claro que la 
reserva (con cierto tipo de relación con la frecuencia del reforzamiento) 
está controlando la respuesta. Varios hechos experimentales apuntan 
hacia esta conclusión, el primero de los cuales es la forma de la curva 
de extinción obtenida después de reforzamientos a una razón fija. 

En la figura 95 damos cuatro curvas de extinción típicas correspon- 
dientes a las ratas de los experimentos precedentes. Se obtuvieron sim- 
plemente suspendiendo el reforzamiento durante una hora. La curva 
más pequeña corresponde a una de las ratas que fue incapaz de mante- 
ner razones altas y, a causa de la reserva relativamente pequeña, mues- 
tra más claramente el efecto sobre la curva de extinción de la diseri- 
minación basada en S?, . Cuando la rata empieza a responder el día 
de la extinción, comienza a producir una estimulación discriminativa 
que a la luz del programa de reforzamiento anterior aumenta la pro- 


babilidad de que reciba un reforzamiento. Cada respuesta aporta a la 
situación una cierta cantidad de S?, y con ello fortalece a la operante. 
El resultado es que la tasa de respuesta mantiene su nivel máximo y 
la reserva disponible se agota en diez o quince minutos en vez de ser 
emitida a una tasa gradualmente decreciente durante toda la hora 
como en la extinción normal. Los registros de las ratas con reservas 
de más capacidad son semejantes con dos excepciones: 1) se necesita 
la mayor parte de la hora para drenar la reserva; 2) se produce un 
estadio de transición entre los períodos de respuesta rápida y muy 
lenta. La dinámica real de la reserva no se conoce aún lo suficiente- 
mente en el momento presente como para posibilitar una explicación 
plausible de este estadio de transición. La tercera curva de la figura 
presenta dos transiciones incipientes durante las cuales la cantidad 
total de S?, se ve reducida, pero es reconstruida cuando se consume 
una parte restante de la reserva. A causa de estas interrupciones no 
se alcanza ninguna sección horizontal antes del fin de la hora, como en 
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los demás casos. (El fin de la tercera curva quedó registrado a medias, 
pero la línea punteada indica aproximadamente su curso.) 

Estas curvas no son extraordinariamente uniformes, pero el efecto 
principal del reforzamiento a una razón fija está claro. Es suficiente- 
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ExTINCIÓN DESPUÉS DE REFORZAMIENTO PROLONGADO A RAZONES FIJAS 


mente preciso para decir que si una respuesta va a ser emitida, se 
producirá lo más pronto posible, a causa del hecho de que bajo el re- 
forzamiento a una razón fija una respuesta no reforzada aporta una 
estimulación discriminativa que fortalece a la operante. En la extinción 
normal la operante se ve debilitada por una respuesta no reforzada. 
Aquí se ve fortalecida hasta que se alcanza el límite de la reserva. Esta 
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formulación no tiene en cuenta las respuestas accesibles en cualquier 
caso el primer día, pero que podrían aparecer en forma de “restable- 
cimiento” tiempo después, pero debiera tomarse en consideración dicho 
hecho. 

Esta peculiaridad de la curva de extinción no se desarrolla hasta 
que el reforzamiento a una razón fija ha tenido tiempo para establecer 
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Ficura 96 
EXTINCIÓN DESPUÉS DE UN BREVE REFORZAMIENTO A RAZONES FIJAS 


El carácter de las curvas de la figura 95 no queda reflejado en ellas porque la 
discriminación temporal todavía no se ha desarrollado 


su discriminación apropiada. La extinción después de un reforzamiento 
con razones bajas, el cual no requiere la discriminación para mante- 
nerse, tiene las propiedades usuales. En la figura 96 A (p. 310) se 
muestra primero un aumento de tasa como resultado del cambio del 
recondicionamiento periódico al reforzamiento con una razón baja. En 
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la flecha se omitieron los reforzamientos y se produjo una curva normal 
de extinción. En la figura 96 B mostramos primero un registro de res- 
puesta rápida bajo la razón baja de 12:1. La segunda curva es la 
extinción obtenida al día siguiente. Está claro que en esos casos no 
se destinó bastante tiempo para el desarrollo de la discriminación tem- 
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LA PERSISTENCIA DE 1A ESTIMULACIÓN DISCRIMINATIVA TEMPORAL DE UN 
GRADIENTE A OTRO 


poral peculiar del reforzamiento a una razón fija y que la curva de ex- 
tinción no se ve así afectada. 


Puede notarse, de paso, que en el experimento representado en la 
figura 95 se alcanzan tasas de respuesta sumamente elevadas. Las dos 
primeras curvas muestran al menos 1.400 respuestas hechas en unos 
veinte minutos. En ambas curvas hay ráfagas de varios centenares de 
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respuestas cada una de ellas a la tasa de al menos 100 respuestas por 
minuto. Estos registros pueden compararse con los reproducidos en 
otras ocasiones (por ejemplo, con la curva A de la figura 87) en los 
que se mantienen de manera muy uniforme tasas de menos de una 
respuesta por minuto. La fuerza de la operante que estamos estudian- 
do, por consiguiente, puede variar por un factor de al menos cien bajo 
los procedimientos descritos en este libro. La significación de este 
hecho en toda consideración de las dimensiones de la fuerza de la con- 
ducta operante ya se ha señalado. Pero volveremos de nuevo sobre ella 
en el capítulo siguiente. 


Debido a la forma de la curva de extinción típica después de un 
reforzamiento a una razón fija, podemos suponer que el efecto de la 
acumulación de S?, es forzar la reserva originando respuestas que bajo 
estimulación discriminativa normal hubieran permanecido en ella por 
algún tiempo. Cabe esperar el mismo efecto en el caso de razones de 
reforzamiento más altas, y de ahí que fuera posible más arriba recurrir 
al estado de agotamiento de la reserva como factor determinante de 
la tasa de respuesta poco después de un reforzamiento. Cuando la 
reserva no se ve forzada, el efecto de S%, es imperceptible; la rata 
vuelve a la palanca muy poco tiempo después de ingerir un gránulo. 
Pero la ráfaga precedente que ocurre bajo reforzamiento a una razón 
fija causa un estado de esfuerzo en la reserva que en conjunción con 
S?,, produce una pausa de cierta duración. 

De ello se desprenden dos resultados experimentalmente observa- 
dos. Uno de ellos es la naturaleza de la conducta subsiguiente de la 
rata cuando una ráfaga determinada se ve interrumpida por alguna 
razón antes del reforzamiento. La interrupción permite a la reserva res- 
tablecerse hasta cierto punto, y cuando la rata recibe por fin el refor- 
zamiento, a éste sigue una pausa más corta que la de costumbre. En 
la figura 97 (p. 311) damos un ejemplo típico. En el punto indicado 
por la flecha se interrumpió por algún tiempo la aceleración usual que 
culmina en un reforzamiento. El retraso que sigue al reforzamiento 
siguiente es insignificante, porque el efecto de Sf., es apoyado con me- 
nor vigor por el drenaje de la reserva. Este efecto compensatorio, se- 
mejante bajo muchos aspectos, a los ya descritos en capítulos anteriores, 
constituye una prueba palpable de la existencia de una reserva subya- 
cente siempre que ocurre. 

El segundo hecho que apoya el efecto de la reserva como deter- 
minante de la tasa después de la ingestión, es la relación existente 
entre dicha tasa y la razón con que se refuerza la respuesta. Es evi- 
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dente que el estado de tensión impuesto por la acumulación de S», 
será tanto mayor cuanto más alta sea la razón, y debiera haber una 
pausa media proporcionadamente mayor después de la ingestión. Esta 
predicción se ve confirmada por el resultado experimental. Es cierto, 
desde luego, que no sólo se ve afectada la primera pausa, Sino también 
la aceleración subsiguiente, pero para el problema que estamos tra- 
tando bastarán las mediciones de las pausas. Se logró una estimación 
de la pausa posterior a la ingestión midiendo las cinco primeras pau- 
sas de tres registros correspondientes a cada razón y a cada rata, to- 
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Ficura 98 
Círculos blancos: duración de la pausa en segundos, después de la ingestión del 
gránulo en función de la razón de extinción. Círculos negros: número de gránulos 
recibidos por hora a diferentes razones fijas 


mando la precaución de no usar los registros en los que se efectuaba 
una transición de una razón a otra. Todas las ratas mostraron la ten- 
dencia del promedio, que consistía en un retraso creciente a medida 
que aumentaba la razón. Los retrasos medios fueron de 73 segundos a 
una razón de 48:1, de 96 segundos a una razón de 96: 1 y de 120 se- 
gundos a una razón de 192:1, tal como aparece en la figura 98. Se 
puede deducir del examen de los registros de la figura 91, que las 
diferencias serían aún mayores si el efecto sobre la aceleración se tu- 
viera en cuenta después de la pausa. 

(El efecto de la reserva es responsable del hecho de que no haya 
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una relación simple entre la razón y el número de gránulos recibidos 
durante una hora. La relación real se ha incluido en la figura 98 en 
líneas punteadas. Así, a una razón de 192:1 las ratas recibieron, como 
promedio, 7,2 gránulos durante la hora; a una razón de 96:1, 18,1 y 
a una razón de 48: 1, 20,0.) 

Hasta ahora he mostrado simplemente que bajo el reforzamiento a 
una razón fija ocurre una discriminación temporal que es diferente de 
la que se produce bajo reforzamiento periódico y que da cuenta de la 
forma de la curva resultante, Pero, sin embargo, el problema de cómo 
en tal caso se excede la razón de extinción no ha quedado plenamente 
resuelto. El hecho que debemos explicar no son los diversos cambios 
de tasa que ocurren bajo reforzamiento a una razón fija, sino el mante- 
nimiento observado de una tasa media elevada. Si demostramos que 
Opera una discriminación especial durante el reforzamiento a una razón 
fija, podemos recurrir a la explicación del efecto reforzante del estímulo 
discriminativo descrito en el capítulo 6 (página 261). Bajo una razón 
fija, una respuesta produce una estimulación discriminativa correlacio- 
nada positivamente con un reforzamiento. Por consiguiente, el caso es 
comparable a aquel en que una luz ha adquirido valor discriminativo y 
en que la presentación de la luz refuerza una respuesta. Cuando una 
rata aprieta una palanca 192 veces para obtener comida, la comida re- 
fuerza la última respuesta (y quizás unas cuantas respuestas anteriores) 
directamente, Pero existe otro tipo de reforzamiento que actúa so- 
bre otras respuestas, a saber, la producción de S?, . Las primeras 
respuestas de cada ráfaga, hablando vulgarmente, no se emiten porque 
produzcan comida sino porque aproximan la obtención de la comida. 
Producen el S?, acumulado en presencia del cual será reforzada una 
respuesta de la misma forma que (en el experimento descrito en el ca- 
pítulo 6) producían la luz. 

Este estado de cosas puede clarificarse considerando el caso en que 
el acto particular reforzado por la comida es la presión de la palanca 
dos veces seguidas. Si la respuesta fuera la pulsación doble de la pa- 
lanca, deberíamos esperar que un solo reforzamiento periódico estable- 
ciera una reserva de veinte pares de respuestas, pongamos por caso, o 
sea cuarenta pulsaciones. Ahora bien, podemos contar cada par como 
Una respuesta o recurrir al hecho de que la primera presión produce, 
y es por consiguiente reforzada, por el S” en presencia del cual la segun- 
da respuesta produce reforzamiento. Esto era casi lo que sucedía en el 
capítulo 6, excepto que la estimulación proporcionada por el hecho 
de apretar la palanca se veía aumentada por la estimulación de la luz 
en presencia de la cual se reforzaba la segunda pulsación. 
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Fundamentalmente, este problema sólo radica en la definición de 
unidad de conducta. Como formulación bastante general, podemos 
decir que cuando un reforzamiento depende de la ejecución de una 
serie de actos similares, todo el grupo tiende a adquirir el rango de 
una sola respuesta y la contribución a la reserva tiende a hacerse en 
términos de grupos. Pero el proceso a través del cual ello se produce, 
al ser analizado, resulta ser el desarrollo del tipo de discriminación que 
hemos estado considerando. Con un organismo como la rata, probable- 
mente nunca se realiza una contribución a la reserva proporcionada a 
un gran grupo. La unidad del grupo como “respuesta” nunca se realiza 
plenamente. Y desgraciadamente es difícil proceder a la comprobación 
del fenómeno a base de grupos pequeños porque la razón de extinción 
fija un límite inferior. En este experimento, la rata, por supuesto, no al- 
canza el punto de apretar la palanca 192 veces como una “sola” res- 
puesta estrictamente definida. Pero la tendencia hacia el estableci- 
miento de esta “respuesta” es responsable de las aparentes altas razones 
de extinción aquí observadas. La discriminación que es responsable del 
reforzamiento intermedio de las respuestas nunca se desarrolla plena- 
mente, pero alcanza la medida en que puede mantenerse la razón de 
192 pulsaciones por un solo reforzamiento. 

Incluso a una razón de 16: 1, que está por debajo de la razón de ex- 
tinción normal a este nivel de impulso, está claro que la rata no aprieta 
la palanca 16 veces “como una respuesta”. En la figura 99 presentamos 
cuatro registros correspondientes a una de las ratas del experimento an- 
terior que fueron sometidas a una razón de 16:1 tras haber mantenido 
la de 192:1. El primer registro muestra la transición descrita más 
arriba en que cada respuesta cobra el nuevo valor de SP, A esta razón 
se reciben gránulos con tanta frecuencia que un cambio de apetito 
produce una aceleración negativa característica (ver capítulo 9). Pero 
las pausas entre cada grupo de respuestas son considerablemente ma- 
yores que cuando cada respuesta produce comida. La discriminación 
temporal no es lo bastante completa como para conceder a dieciséis pul- 
saciones el rango de una sola respuesta y la reserva impone un efecto 
limitativo. El retraso durante la primera parte de estos registros es típico, 
pero no se explica. 

Cuando hablamos de dieciséis pulsaciones que actúan como “una 
sola” respuesta, planteamos el problema de la definición de la respuesta 
como unidad fundamental, problema que no vamos a resolver aquí. 
Existe un importante paralelo en el caso de las ráfagas de respuestas, 
que consiste en la repetición de un grupo de respuestas separadas. Cuan- 
do no se proporciona ninguna estimulación discriminativa externa (como 
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cuando la ráfaga tiene lugar en una rueda de actividad), el reforzamien- 
to de una cantidad determinada de ráfaga actúa directamente sobre el 
último grupo de escalones, pero no necesariamente sobre el resto de la 
serie. ¿En qué sentido se aplica aquí el principio de la reserva? Segu- 
ramente la respuesta depende de un reforzamiento adicional proporcio- 
nado por una discriminación similar a la del caso de pulsaciones repeti- 
das. A medida que se desarrolla esta discriminación, un reforzamiento 
secundario se extiende a los primeros miembros de la secuencia de res- 
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CADA PELDAÑO: 16 RESPUESTAS 


TIEMPO (UNA HORA) 


FicurA 99 
REFORZAMIENTO A UNA RAZÓN DE 16:1 


El registro superior muestra un reajuste de la discriminación temporal como en 
la figura 94. La aceleración negativa de todos los registros es debida a un cambio 
de impulso (ver capítulo 9) 


puestas. En el capítulo noveno describimos algunos de los experimentos 
sobre el reforzamiento de la ráfaga de respuestas. 


La conducta de la rata bajo reforzamiento a una razón fija explica 
algunas de las propiedades de los registros tomados en los primeros ex- 
perimentos sobre recondicionamiento periódico, particularmente el 
desarrollo de las desviaciones de segundo orden (pág. 139) y ciertas ano- 
malías de la curva de extinción después de recondicionamiento prolon- 
gado. La explicación descansa sobre el hecho de que cuando se ha es- 
tablecido la desviación de tercer orden (que ahora interpretamos como 
una discriminación temporal basada en la recepción y la ingestión de 
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la comida), se produce una correlación indirecta resultante entre el re- 
forzamiento y la tasa de respuesta, similar a la imperante bajo refor- 
zamiento a una razón fija. Tan pronto como se desarrolla este tipo 
de desviación, una larga pausa sigue a cada reforzamiento, pero a menos 
que sea tan larga como el mismo período de reforzamiento nunca se 
ve seguida por un reforzamiento. Esto es lo contrario que sucede con el 
reforzamiento preferencial usual de largas pausas que se obtiene bajo re- 
forzamiento periódico. Además, la pausa va seguida por un período 
de rápida respuesta en el que el retraso efectúa la compensación, y esto, 
normalmente, continúa hasta que la rata recibe el reforzamiento. Así, 
pues, existe una correlación indirecta entre respuesta rápida y reforza- 
miento. En las frecuencias superiores de reforzamiento periódico el resul- 
tado combinado de esas correlaciones indirectas es suficiente para pro- 
ducir el tipo inverso de discriminación que caracteriza el reforzamiento 
a una razón fija y dar una curva ligeramente festoneada. Puede ser con- 
veniente repasar la discusión de las desviaciones de segundo orden del 
capítulo 6 así como comparar la figura 32 con la figura 91. En la primera 
figura los festones no respetan plenamente los momentos del reforza- 
miento; las rupturas ocurren en los reforzamientos pero no en todos 
ellos. Los registros indican que la rata empieza a verse afectada por la 
pseudocorrelación y por tanto acelera su respuesta considerablemente 
como en la figura 87. La correlación se interrumpe inmediatamente y la 
ganancia de la reserva es escasa o nula. Sin embargo, la reserva se ve 
forzada por la rápida respuesta y cuando se recibe S£,. aparece un des- 
censo repentino. El proceso se vuelve a repetir posteriormente. 

Esta especulación cualitativa en cuanto a la causa de la desviación de 
segundo orden no es en sí misma muy convincente, pero la afirmación 
de que las correlaciones entre reforzamiento y rápida respuesta, y entre 
falta de reforzamiento y una pausa, en realidad establecen una discrimi- 
nación se ve corroborada por la curva de extinción obtenida después de 
prolongado reforzamiento periódico, a las tasas más altas en que se ob- 
serva el efecto. En la figura 100 representamos los tres primeros días de 
la extinción del reflejo de la rata P7. El proceso se inició tras el prolon- 
gado recondicionamiento periódico mostrado en la figura 29. Como 
podemos ver, durante los veinte primeros minutos indicados en el pri- 
mer registro, la rata apretó la palanca más de doscientas veces. Sin em- 
bargo, el período de compensación que siguió muestra que se trataba de 
un estado temporal “de tensión”, ya que la rata respondió sólo intermi- 
tentemente durante un período de más de una hora, al final del cual la 
curva se acercaba probablemente a su posición teórica. (Es evidentemen- 
te difícil inferir el *verdadero” curso del registro.) La transición de la 
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elevada tasa a la depresión que sigue es notablemente suave. El segundo 
día ocurre un overshooting semejante y al tercer día podemos discernir 
una huella del mismo. Esas curvas, evidentemente, se parecen a las de 
extinción después de reforzamiento a una razón fija (figura 95). Las res- 
puestas se apelotonan al principio de la curva, ésta pasa por un estadio 
de transición y al final alcanza una tasa de respuesta muy baja. El esta- 
dio de transición incipiente se parece mucho al de la tercera curva de la 
figura 95. En el presente caso, durante los días siguientes se exploró una 
ulterior extinción. Se produjeron de nuevo períodos de rápida respuesta, 
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RESPUESTAS 


k———— 1 HORA ———1 


FicGurRA 100 ? 


Errcrto SOBRE LA EXTINCIÓN DE UNA PSEUDODISCRIMINACIÓN TEMPORAL 
DESARROLLADA BAJO REFORZAMIENTO PERIÓDICO ORDINARIO 


aunque el efecto se vio retardado y fue menos extenso. Seguramente se 
podrían haber obtenido curvas similares permitiendo una extinción ul- 
terior, en días posteriores, a las ocho ratas a que nos hemos referido 
más arriba, pero ello no se hizo porque dichas ratas fueron utilizadas 
para la prueba final de la presente interpretación que pronto pasaremos 
a exponer. 

La pseudocorrelación entre el reforzamiento y la rápida respuesta 
que puede prevalecer bajo reforzamiento periódico acentúa la desviación 
de tercer orden iniciada por la discriminación temporal basada en el 
reforzamiento. Sf., es responsable de la baja fuerza inicial después de la 
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ingestión, pero al final es responsable del debilitamiento de S” a partir de 
las respuestas anteriores y por ello tiende a prolongar el período de no- 
respuesta después de la ingestión. Es por esta razón que la desviación 
de tercer orden aparece primero en las tasas más elevadas de respuesta 
en que la correlación indirecta se experimenta en primer lugar. 

Cabría esperar que la rata estuviera menos inclinada a responder 
poco después de la comida si tiene que esperar, por ejemplo, doce minu- 
tos antes de comer de nuevo que si tiene que esperar tres, pongamos por 
caso. Pero, como muestran las figuras 30 y 31, no sucede así. El efecto 
contrario es debido al hecho de que con el reforzamiento periódico cada 
tres minutos se mantiene una tasa alta, en la que aparece la discrimina- 
ción característica del reforzamiento a una razón fija. El carácter escalo- 
nado de los registros, pues, es primero debido a la discriminación basada 
en la ingestión de la comida, y segundo al debilitamiento de SP ocasiona- 
do por el retraso causado por esta discriminación. Si aumentamos la tasa 
de respuesta manteniendo al mismo tiempo la frecuencia de reforzamien- 
to constante (como, por ejemplo, cambiando el impulso) podemos mostrar 
que la aparición de los escalones en las tasas altas solamente, no es 
debido a la frecuencia de reforzamiento, sino más bien a la tasa de res- 
puesta. En experimentos sobre cambio de impulso (citados en el capítu- 
lo 10), se demuestra un acusado carácter escalonado poco después 
de que la tasa alcance un valor suficientemente alto. 


Reforzamiento periódico después de reforzamiento 
a una razón fija 


La pseudocorrelación entre rápida respuesta y reforzamiento que 
puede prevalecer bajo recondicionamiento periódico simple, es especial- 
mente probable que ocurra cuando se vuelve a un procedimiento de 
recondicionamiento periódico después de reforzamiento a una razón 
fija, Aun cuando ahora los reforzamientos están dispuestos temporal- 
mente, la rata seguirá respondiendo casi invariablemente hasta que re- 
ciba un reforzamiento, y la relación resultante entre los reforzamientos 
y las largas ráfagas de respuestas no deja de ser real por el resultado in- 
directo del entrenamiento previo de la rata. La persistencia de una 
discriminación que no se justifica por las condiciones del experimento 
dependerá en gran medida de factores accidentales. Cabe esperar un 
reforzamiento ocasional después de una pausa, si la conducta de la rata 
admite pausas. En muchos casos éstas ocurren y entonces la pseudodis- 
criminación finalmente se interrumpe. Pero en el próximo experimento 
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sobre este extremo encontramos poca consistencia en la tasa de inte- 
rrupción. 

Tras el solo día de extinción antes descrito, siete de las ratas del 
grupo descansaron durante trece días y luego fueron sometidas al pro- 
cedimiento de reforzamiento a una razón fija. Se obtuvieron las tasas 
usuales de 96:1 (64:1 en tres casos) y se utilizaron para calcular perío- 
dos de reforzamiento que produjeran el mismo número de reforzamien- 
tos por hora. Por ejemplo, si una rata hizo 800 respuestas por hora a una 
razón de 96:1 recibió ocho reforzamientos, además del suministrado a 
la primera respuesta (que siempre fue reforzada). El reforzamiento pe- 
riódico a intervalos de siete minutos produciría el mismo número y por 
tanto el período se fijó a siete en tal caso. Se trataba simplemente de 
una inversión del cambio descrito anteriormente en el capítulo en que 
se calculaba una razón a partir de la tasa bajo reforzamiento periódico. 
La significación del cambio para la rata también se invirtió. La alta tasa 
de 800 respuestas por hora ya no era necesaria. Si las nuevas condiciones 
hubieran sido lo bastante claras para destruir la discriminación sobre la 
que descansaba la conducta de la rata, su tasa debiera de haber descen- 
dido hasta la determinada por la razón de extinción, o sea, por ejemplo, 
a 150 respuestas por hora. 

Se obtuvieron los resultados siguientes: Las dos ratas que previa- 
mente habían sido incapaces de sostener razones por encima de 64:1 y 
estaban operando a dicha razón no presentaron ningún cambio significa- 
tivo durante los dieciocho días bajo el procedimiento de reforzamiento 
periódico. Esas ratas tenían que realizar el cambio mínimo, pero no 
se observó ningún intento en la dirección correcta. Otras dos ratas mos- 
traron un dumento de tasa después del cambio, que prosiguió más o me- 
nos irregularmente durante diez días en un caso y durante cuatro en el 
otro. La razón del aumento era aparente en la conducta real de las 
ratas. Siempre que se iniciaba una ráfaga después de un retraso menor 
que el retraso medio, la primera razón correcta se alcanzaba antes del 
momento del reforzamiento. La rata continuaba respondiendo y el efecto 
consistió en introducir reforzamientos a razones mayores a las que previa- 
mente había sido sometida. Como en el caso de las dos primeras ratas 
no se produjo ninguna interrupción de la discriminación. Por el contrario, 
el procedimiento originó un incremento de la razón media de respuestas. 
Las tres ratas restantes mostraron el descenso progresivo de tasa que ca- 
bría esperar en ausencia de influencias perturbadoras. 

Se hizo un intento —que se vio coronado por el éxito— para demos- 
trar el papel desempeñado por la pseudocorrelación entre el reforza- 
miento y la rápida respuesta disponiendo deliberadamente el aparato 
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de tal forma que se produjera un reforzamiento sólo cuando la rata no 
hubiera estado respondiendo durante, al menos, quince segundos. Bajo 
esta condición nunca se reforzaba ninguna respuesta si ésta había venido 
precedida por otra respuesta en el plazo de quince segundos. En todos 
los casos el efecto fue claro a todas luces. El primer día bajo el nuevo 
procedimiento, mostró una ligera subida en algunos casos cuando la rata 
estaba respondiendo tan rápidamente que no siempre se podían hallar 
intervalos de quince segundos en el momento aproximado del reforza- 
miento y, por lo tanto, se emitieron carreras muy largas. Sin embargo, 
se logró el número requerido de reforzamientos y ello sólo después de 
pausas de quince segundos. Al segundo día la tasa cayó y siguió cayen- 
do en los días siguientes hasta que se alcanzó un valor relativamente 
estable. Al último día del experimento se estableció la razón original 
como control y la tasa inmediatamente subió hasta aproximadamente el 
valor alcanzado antes de que se insertara el intervalo de quince se- 
gundos. 
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8. La diferenciación 
de una respuesta 


El problema 


Es preciso distinguir entre la discriminación del estímulo y el proceso 
de diferenciación entre formas de respuesta. La tendencia a situar toda 
la conducta dentro del marco de la respondiente, con la implicación de 
una relación estímulo-respuesta estricta y ubicua, es quizá responsable 
del olvido de esta distinción en los trabajos sobre discriminación que 
se llevan a cabo en la actualidad. Si a cada respuesta correspondiera 
rigurosamente un estímulo, una discriminación entre las dos formas de 
cada término implicaría necesariamente las formas correspondientes del 
otro y, por tanto, no habría necesidad de considerar más de un proceso. 
Pero en la conducta operante la fuerza de una respuesta puede variarse 
independientemente y pueden distinguirse dos formas estrechamente re- 
lacionadas de una respuesta al desarrollar diferentes fuerzas, indepen- 
dientemente de los estímulos discriminativos. El proceso es completa- 
mente diferente del descrito en el capítulo 5. 

Al condicionar uma operante, se hace contingente un reforzamiento 
a la ocurrencia de una respuesta que tenga ciertas propiedades. Por 
ejemplo, la presentación de la comida se hace contingente a cualquier 
movimiento del organismo que apriete una palanca. Cuando se produce 
una respuesta conveniente, se ve fortalecida por el reforzamiento. El pro- 
blema de la discriminación sensorial se plantea porque el etzcto refor- 
zante es independiente en una medida considerable de la estimulación 
que se presenta en el momento de la emisión de la respuesta. A través 
del proceso de inducción, el fortalecimiento de la respuesta puede exten- 
derse a una situación estimulante diferente. Pero esta inducción “senso- 
rial” tiene un paralelo que se refiere solamente a la respuesta. Las 
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provocaciones subsiguientes de una respuesta que se deben a una refor- 
zamiento determinado, tanto si se hacen en el mismo campo estimulante 
como si no, pueden diferir en algunas de sus propiedades. La palanca 
puede apretarse desde una posición diferente o con una pata distin- 
ta, etc. Este es otro tipo de inducción, el cual origina el problema que 
vamos a considerar en este capítulo. Para evitar confusiones al hablar 
de discriminación sensorial usaré los términos ya presentados. No obs- 
tante, a partir de ahora voy a denominar diferenciación la discriminación 
de la forma de una respuesta. 

Supongamos por un momento que puede describirse completamente 
una respuesta enumerando tres propiedades. Se hace contingente un 
reforzamiento a la ocurrencia de la respuesta Rabc. Ocurre la respuesta 
y se ve fortalecida. Las respuestas siguientes que ocurren como conse- 
cuencia de este reforzamiento no son réplicas exactas de Rabc, sino que 
deben representarse como Rabd, Rafc, etc. Ahora bien, si el reforza- 
miento es contingente sólo a la propiedad a, todas esas respuestas serán 
también reforzadas. Ello producirá una extensión inductiva todavía más 
amplia, con grandes desviaciones de Rabc. Al final puede provocarse 
mediante inducción una respuesta que no posea la propiedad requerida 
para el reforzamiento. Dando por supuesta la existencia de un reforza- 
miento circunscrito de forma bastante precisa, reforcemos Rabc y no 
Rabd. Cuando ocurre Rabd a causa de la inducción a partir de Rabc, se 
extinguirá parcialmente. Se producirá una acción inductiva inversa sobre 
Rabc, pero como el efecto directo del condicionamiento y la extinción es 
mayor que el inductivo, las fuerzas de Rabc y Rabd se separarán. A me- 
nos que, como en el caso de la discriminación sensorial, haya una inte- 
rrupción real de la inducción, el ulterior reforzamiento de Rabc conti- 
nuará produciendo una aparición ocasional de Rabd. 

Cuando el reforzamiento permite una cierta flexibilidad de forma, 
una respuesta tiende a reducirse espontáneamente y a persistir con un 
conjunto de propiedades circunscrito de forma bastante precisa. Los dos 
principales mecanismos responsables de esta reducción son los siguientes : 


1. Frecuencia. Ya que el fortalecimiento directo es mayor que el in- 
directo, la forma que ocurre con más frecuencia automáticamente se 
fortalece de forma preferencial. La primera forma reforzada tiene una 
ventaja inicial y puede persistir como una “fijación”. 


2. Reforzamiento negativo concurrente. La ejecución de una res- 
puesta puede proporcionar estimulación reforzante negativa tendente a 
reducir el efecto reforzante neto. La “dificultad” y la “torpeza” pueden 
expresarse en términos de la estimulación reforzante negativa automáti- 
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camente producida por una respuesta. Si los diversos miembros de un 
grupo inductivo de respuestas difieren en torpeza o dificultad, se pro- 
ducirá un efecto diferencial del reforzamiento. Prevalece la forma más 
simple y más fácil, porque recibe un reforzamiento positivo sin efecto 
emocional deprimente. (Ver el apartado sobre el Reforzamiento negativo 
del capítulo 3.) Este factor puede corregir la persistencia de una forma 
tosca de respuesta debida al factor de la frecuencia. 

Las formulaciones anteriores se basan en gran parte en observacio- 
nes casuales y no dispongo de experimentos especiales que citar. La va- 
riación de la forma de una respuesta durante provocaciones sucesivas se 
observa fácilmente. La “fijación” de una forma precisamente circuns- 
crita ocurre ocasionalmente. Por ejemplo, una rata puede continuar apre- 
tando la palanca con su hocico o sus dientes si primero responde de esta 
forma. El caso más común es el desarrollo de una respuesta fácil y efi- 
ciente hecha con una pata o con ambas. Si se cambian las propiedades 
requeridas, la rata se ajusta rápidamente. Este proceso se refiere a las 
propiedades descriptivas y puede designarse como la “diferenciación 
topográfica” de la respuesta. El problema es semejante al del condicio- 
namiento original. Sin embargo, existe otra faceta del problema de la di- 
ferenciación que se refiere a las propiedades cuantitativas (intensivas o de 
duración). El reforzamiento puede hacerse contingente a la pulsación 
de la palanca con una cierta presión o al mantenimiento de la palanca 
apretada hacia abajo durante un período de tiempo determinado. Aquí 
las propiedades topográficas no cambian en gran medida, pero existe 
aún un claro proceso de diferenciación. Al llegar a apretar la palanca 
con una cierta presión, por ejemplo, la rata “aprende algo nuevo”, pero 
el proceso no puede asimilarse a los casos ya descritos. Así, pues, este 
capítulo será consagrado a esta diferenciación cuantitativa. 

Se precisan piezas adicionales para registrar los valores de las pro- 
piedades que examinamos y asegurar el reforzamiento preferencial de 
las respuestas que tienen un valor determinado de la propiedad elegida. 
El reforzamiento diferencial de las respuestas según su intensidad se 
logra conectando la palanca a un péndulo balístico. El recorrido del 
péndulo está en función de la fuerza con que se pulsa la palanca. Cuando 
el péndulo ha hecho el recorrido requerido se cierra un contacto eléctrico 
ajustable, Para medir la duración, al apretar la palanca se pone en marcha 
un mecanismo de relojería Telechrón, el cual sigue funcionando hasta 
que se suelta la palanca. Al soltar la palanca el mecanismo de relojería 
vuelve a la posición cero. Para registrar la intensidad y la duración se 
utiliza un quimógrafo especial, cuyo tambor recorre una distancia uni- 
forme a cada respuesta. La intensidad o la duración son representadas 
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por el movimiento vertical de una plumilla, sumando los valores de las 
respuestas sucesivas. El valor de una sola respuesta puede leerse directa- 
mente a partir del registro; los valores de un grupo de respuestas forman 
una línea escalonada, cuya pendiente da el valor medio. Para convertir 
la intensidad en un movimiento linear se conecta un pequeño volante 
a la palanca. Una respuesta hace girar el volante de acuerdo con la pre- 
sión ejercida. El volante está engranado con un eje que enrolla un cable 
unido a la plumilla. Para registrar el tiempo de la misma forma no hay 
más que dejar que la palanca cierre el circuito de un reloj, cuyo eje 
enrolla asimismo un cable conectado a la plumilla. 


140 


100 


PESO TOTAL 


RESPUESTAS 


Ficura 101 
CURVAS DE CALIBRACIÓN PARA LA INTENSIDAD DE LA RESPUESTA A LA PALANCA 


Las curvas se registraron haciendo descender repetidas veces la palanca con pesas 
atadas a ella (el peso viene indicado en gramos) 


Todos estos mecanismos pueden ser calibrados fácilmente. En el caso 
de la intensidad se ata una pesa a la palanca de forma que ésta des- 
cienda repetidas veces abandonando su posición normal. Los registros 
hechos por la rata se comparan con las curvas de calibración hechas con 
diferentes pesas. Las curvas de calibración para las duraciones se obtie- 
nen manteniendo la palanca apretada repetidas veces durante intervalos 
de tiempo elegidos previamente y medidos con un cronómetro. En la 
figura 101 presentamos unas cuantas curvas de calibración de la inten- 
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sidad. Se registraron haciendo descender la palanca varias veces utili- 
zando diferentes pesas incorporadas a la misma tal como viene indicado 
(de 20, 40, 60, 100 y 140 gramos). El aumento de la pendiente con el peso 
no es lineal a causa de la fricción del volante y de otros factores, pero 
creemos que este dispositivo proporciona una medida adecuada de cual- 
quier fuerza dada. Se da una ligera irregularidad, especialmente en las 
pendientes más bajas, que limita el uso del registro al medir una sola 
respuesta. Pero tratándose de un grupo de respuestas el registro es 
suficientemente riguroso para nuestro propósito presente. Las curvas de 
duración son similares, excepto que la curva varía linealmente con la du- 
ración y los registros son válidos para las respuestas aisladas. Con los 
valores coordinados usados, la duración media de una serie de respues- 
tas puede obtenerse diviendo la tangente del ángulo del registro con la 
horizontal por 0.009. 

Los datos que vamos a citar se obtuvieron con grupos de cuatro a 
dieciséis ratas. No aportamos ningún dato en el que hayamos observado 
alguna excepción a menos que así lo hagamos constar. Sin embargo, no 
describimos los experimentos con detalle así como tampoco exponemos 
un resumen de todos los datos obtenidos. 


Diferenciación de la intensidad: 
la presión normal de la respuesta 


La presión normal con que se pulsa la palanca viene mostrada en las 
partes de las curvas de la figura 102 hasta los puntos marcados con 
una E. Las ratas se sometieron a prueba durante breves períodos a lo 
largo de varios días sucesivos. Cada día se reforzaron de quince a veinte 
respuestas. En la figura, los registros diarios están separados por líneas 
verticales. El primer registro de cada caso muestra la fuerza del día del 
condicionamiento. En la serie A, la presión excepcionalmente baja es 
apenas suficiente para hacer descender la palanca. La pendiente de la 
serie B está cerca de la media de todas las ratas examinadas, y la cali- 
bración indica el efecto de un peso de 35-40 gramos. La serie C muestra 
una presión excepcionalmente elevada, aunque podemos ver que las 
seis o siete primeras respuestas fueron muy débiles. Más tarde señala- 
remos la significación de este punto. Salvo menores desviaciones locales, 
cada rata mantuvo una presión media constante bajo esas condiciones 
durante todo el tiempo que duró el experimento (de dos a cinco días). 

La figura 102 muestra asimismo el efecto de la extinción sobre la pre- 
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sión. Al tercer día de las series A y C y al quinto de la serie B se refor- 
zaron, primero, diez respuestas de la forma usual y luego se extinguió 
el reflejo, empezando en E. Las curvas de extinción dadas por el cambio 
de tasa tienen la forma usual. En la figura 102 las curvas representan 
el cambio de presión. Prácticamente, en todos los casos algunas respues- 
tas que ocurren durante la extinción muestran un incremento de presión. 
Las respuestas más fuertes generalmente ocurren cerca del fin de la 


GRAMOS POR RESPUESTAS 


RESPUESTAS 
Ficura 102 


INTENSIDAD DE RESPUESTAS INDIFERENCIADAS 


La intensidad media viene dada por la pendiente. En D damos curvas de cali- 

bración con fines comparativos. Las líneas verticales separan los registros diarios. 

Hasta E se reforzaron todas las respuestas, punto en que empezó la extinción. 

Todas las ratas muestran cierta intensificación durante la primera parte de la 
extinción y una intensidad mínima al final de la extinción 


extinción para dar paso a una presión extraordinariamente baja que lue- 
go se mantiene regularmente. Esto queda claramente mostrado, en la fi- 
gura 102, en las secciones relativamente llanas de los finales de los regis- 
tros. Incluso en la serie A la presión media final es menor que la presión 
bajo la respuesta reforzada normal y esto lo podemos apreciar de forma 
aún más evidente en las otras series. La baja pendiente final podría con- 
siderarse como una compensación para las primeras respuestas fuertes, 
pero más tarde avanzaremos otra interpretación. 
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CAMBIO DE PRESIÓN BAJO REFORZAMIENTO DIFERENCIAL 


Aunque durante la respuesta reforzada se mantiene una pendiente 
media relativamente constante, se produce cierta variación en la de las 
respuestas aisladas y, por consiguiente, es posible reforzar diferencial- 
mente con respecto a esta propiedad. Aun cuando haya poca variación, 
el reforzamiento diferencial necesariamente implica la extinción, y así 
aparecen algunas respuestas fuertes. 

Cuando las respuestas se refuerzan diferencialmente con respecto a 
su intensidad, la relativa frecuencia de las respuestas fuertes se incre- 
menta inmediatamente. Es difícil seguir el proceso de cerca a causa de 
la ocurrencia de respuestas fuertes debida simplemente a fallos ocasiona- 
les de reforzamiento. Si se elige para el reforzamiento diferencial un 
valor que es probable que ocurra, por ejemplo, una vez cada diez veces 
sin diferenciación, las respuestas que posean este valor empiezan a ocu- 
rrir más frecuentemente (por ejemplo, una vez cada dos veces) con lo 
cual se produce aparentemente un cambio instantáneo. Las respuestas 
más fuertes pueden exceder la presión requerida y por ello es posible 
avanzar aún más el valor crítico. De esta forma puede obtenerse un va- 
lor medio progresivamente más alto. El primer valor crítico elegido, por 
supuesto, debe estar dentro de la gama normal de variación, pero me- 
diante diferenciaciones progresivas puede alcanzarse, aparentemente, 
cualquier valor dentro de la capacidad de la rata. 

La tasa de avance hacia un valor extremo de la intensidad es más 
lenta de lo que cabría esperar de la velocidad de la primera diferencia- 
ción. En la figura 103 damos dos series de registros que muestran el 
alcance gradual de una elevada intensidad. Cada sección delimitada por 
líneas verticales representa un experimento diario, durante el cual se 
reforzaron veinte respuestas y también ocurrieron respuestas no refor- 
zadas de fuerza inadecuada. Los registros vienen reproducidos en el or- 
den en que se tomaron y en cada uno de ellos se indica también el valor 
requerido para el reforzamiento. Podemos ver que el progreso es lento y 
que en ningún caso la rata alcanza un punto en que todas las respuestas 
son lo suficientemente fuertes para ser reforzadas. El resultado principal 
es el incremento de la pendiente media. Aunque estos experimentos so 
se prosiguieron, sería muy difícil obtener más progreso. En la figura 104 
(de la pág. 380) mostramos el valor medio más elevado que alcanzó una 
rata. Sólo se reforzaron las respuestas cuando eran equivalentes a un 
peso de 100 gramos. (La rata pesaba menos de 200 gramos.) Ya veremos 
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más tarde la importancia del carácter del registro al comparar la dife- 
renciación de la duración de la respuesta. 

El estado aparentemente final alcanzado en una diferenciación de 
este tipo con cualquier valor más allá de la gama normal es aquel en que 
las respuestas alternativas son generalmente lo bastante fuertes para re- 
cibir reforzamiento. Como mostraremos dentro de unos momentos, existe 
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INCREMENTO DE LA INTENSIDAD MEDIA CUANDO SE REFUERZAN LAS RESPUESTAS SÓLO 
EN INTENSIDADES QUE ESTÁN POR ENCIMA DE LOS VALORES CRÍTICOS 


Los valores críticos vienen indicados. Las líneas verticales separan los registros 
diarios. A efectos de comparación, damos las curvas de calibración 
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una tendencia constante a reducir la presión. Cuando la diferenciación 
se hace con dificultad, esta tendencia hace que la presión caiga por 
debajo del valor crítico inmediatamente después de un reforzamiento. 
En la extinción, por otra parte, como vamos a mostrar inmediatamente, 
existe la tendencia a aumentar la presión. Así, pues, la secuencia de acon- 
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FicuraA 104 
INTENSIDAD MEDIA EXCEPCIONALMENTE ALTA 


Sólo se reforzaron las respuestas con una presión superior a los 100 gramos 


tecimientos es la siguiente: 1) la rata emite con éxito una respuesta; 2) 
la presión disminuye y la próxima respuesta es débil; 3) a causa de la 
falta de reforzamiento la presión aumenta y la próxima respuesta recibe 
reforzamiento, etc. Las ratas tienden a adaptarse a una presión sólo lige- 
ramente superior a aquella que asegure el reforzamiento de todas las 
demás respuestas. Esto no se aplica, desde luego, a los valores críticos 
muy bajos, en que la proporción puede ser mucho más elevada. En el 


330 


otro extremo, si la proporción desciende demasiado, la diferenciación se 
pierde completamente. 

La figura 105 presenta un ejemplo típico que muestra cómo puede 
perderse la diferenciación si el valor crítico se eleva demasiado rápida- 
mente. El registro A corresponde al primer día de la diferenciación, cuan- 
do se dispuso el aparato de tal modo que fueran reforzadas aproxima- 
damente la mitad de las respuestas. A medida que se incrementaba la 
presión media, se iba elevando el valor crítico. La discontinuidad que 
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PérDIma DE LA DIFERENCIACIÓN CUANDO SIE ESTABLECE UN VALOR CRÍTICO 
DEMASIADO ALTO 


A: diferenciación original que desarrolla una intensidad media de unos cuarenta 
gramos. B: la diferenciación se pierde cuando se fija al valor crítico a sesenta 
gramos, pero se recupera posteriormente al volverlo a establecer a cuarenta. A los 
sesenta gramos se reforzaron demasiado pocas respuestas para impedir la extinción 


muestra este registro se obtuvo accidentalmente. La presión final de 
este día fue de aproximadamente 40 gramos. Al día siguiente se hizo 
un intento para conseguir respuestas a 60 gramos. El registro B mues- 
tra el resultado. Sólo unas cuantas respuestas al inicio del registro fue- 
ron lo bastante fuertes para ser reforzadas, y la presión media inicial 
se situó ligeramente por encima del valor final del día precedente. Pero 
debido al predominio de las respuestas no reforzadas, se inició la ex- 
tinción y con ella el usual descenso de presión. (Ya mostraremos den- 
tro de poco que el descenso que hemos descrito es también típico después 
de la diferenciación.) A partir de este punto ninguna de las respuestas 
poseyó la intensidad requerida para ser reforzada, y la operante final- 
mente se hubiera extinguido. No obstante, el valor crítico se redujo 
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más tarde a 40 gramos, y entonces se reforzaron una o dos respuestas 
y se recuperó la diferenciación. Entonces el valor crítico se elevó gra- 
dualmente hasta que se mantuvo una media de más de 40 gramos. En ge- 
neral, podemos decir que la tendencia de la presión a declinar en 
la extinción impone la tasa límite hasta la que se puede elevar el valor 
crítico. 

El descenso de presión durante la extinción viene precedido por un 
aumento inicial. A causa de este incremento es posible mantener una 
intensidad relativamente alta reforzando todas las demás respuestas, 
independientemente de su presión. La respuesta no reforzada de cada 
par aumenta la intensidad de la próxima respuesta, la cual se ve refor- 
zada. Así se produce una correlación efectiva entre el reforzamiento y 
las respuestas fuertes, no determinado por el aparato, sino causado in- 
directamente por el reforzamiento de las respuestas alternativas. El 
resultado es una intensidad media considerablemente por encima de 
la base normal. Por ejemplo, una rata que había establecido una ligera 
diferenciación, como ya hemos descrito anteriormente, mantuvo una 
pendiente media de 31.7” durante cinco días en que se alternaron 20 res- 
puestas reforzadas con respuestas no reforzadas. Cuando al sexto día 
se reforzaron todas las respuestas la pendiente cayó a 21” y mantuvo un 
promedio de 18” durante cinco días. Esto equivalió aproximadamente 
a la mitad de la intensidad sostenida por el reforzamiento alternativo. 
Este efecto puede obtenerse sin una diferenciación preliminar (más aba- 
jo ya veremos que existe la posibilidad de una diferenciación ininten- 
cional en todos los experimentos de este tipo). Por ejemplo, una rata 
que no había recibido un reforzamiento diferencial deliberado man- 
tuvo una tasa media de 31.9” durante períodos diarios de reforzamiento 
y extinción alternativos. Cuando se reforzaron todas las respuestas, la 
pendiente descendió hasta 28.5" al primer día y hasta 21” al cuarto día, 
con una media para los cuatro días de 23.9”, En un caso en que fallaron 
varios intentos de elevar la presión mediante reforzamiento diferencial, 
el uso del reforzamiento alternativo tuvo éxito. La pendiente máxima 
obtenida por reforzamiento diferencial fue de 15”. Una serie de cuatro 
días de reforzamientos alternativos dio las pendientes de 15”, 21”, 20? 
y 297, respectivamente. Parece que la explicación de ello es que el re- 
forzamiento alternativo logra obtener un reforzamiento diferencial más 
rápido y más fino que el establecimiento de un valor arbitrario. 
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LA PERDIDA DE DIFERENCIACIÓN 


Cuando se proporciona de nuevo reforzamiento a cada respuesta 
sin tener en cuenta su intensidad, la rata puede o bien seguir respon- 
diendo con una presión suplementaria durante algún tiempo o la presión 
puede descender de forma muy rápida hasta alcanzar un valor casi 
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Ficura 106 


DESCENSO DE LA INTENSIDAD DESPUÉS DE LA DIFERENCIACIÓN CUANDO SE REFUERZAN 
DE NUEVO TODAS LAS RESPUESTAS 


Cuatro registros diarios sucesivos correspondientes a una rata. En cada caso se 
reforzaron primero diferencialmente diez respuestas con una intensidad de cin- 
cuenta gramos o más. A partir de las líneas verticales, se reforzaron todas las 
respuestas, El descenso de la intensidad media puede ser rápido o no, probable- 
mente de acuerdo con correlaciones accidentales entre intensidad y reforzamiento 


normal. En la figura 106 reproducimos cuatro registros tomados de la 
misma rata durante días sucesivos. En cada caso se reforzaron primero 
diez respuestas de una intensidad superior a 50 gramos. Seguidamente 
se reforzaron veinte respuestas consecutivas de cualquier valor. El re- 
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gistro de la parte inferior muestra un escaso cambio de presión mientras 
que, en el otro extremo, el registro superior desciende hasta un nivel 
casi normal después de dos o tres respuestas. Los otros registros mues- 
tran típicas tasas de cambio intermedias. La imposibilidad de obtener 
un resultado congruente quizás se deba a la correlación accidental en- 
tre presión y reforzamiento que todavía se obtiene si las respuestas son 
fuertes, aun cuando esta condición no sea exigida por el aparato. 

De un día para otro, por lo general, ocurre espontáneamente un des- 
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Ficura 107 
PÉRDIDA ESPONTÁNEA DE LA DIFERENCIACIÓN DE UN DÍA PARA OTRO 


A: descenso muy ligero a la intensidad media cuando se reforzaron todas las res- 

puestas (cf. figura 106). B: lo mismo que A, salvo que la línea corta marca un 

intervalo de veinticuatro horas. Al segundo día se produce el descenso inmediato 
a una baja intensidad 
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censo a una presión casi normal. En la figura 107 el registro Á muestra 
el descenso muy ligero, característico de esta rata cuando el reforza- 
miento es primero contingente a respuestas de 65 gramos o más y luego 
se proporciona sin limitación. El registro de B se tomó al día siguiente 
cuando todas las respuestas reforzadas estaban por encima de 65 gra- 
mos. El registro termina con un tercer día en que se reforzaron todas 
las respuestas independientemente de su presión. El efecto de las vein- 
ticuatro horas en el sentido de reducir la presión media es evidente. 
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Ficura 108 


CAMBIO EN LA INTENSIDAD DE LA RESPUESTA DURANTE LA EXTINCIÓN DESPUÉS 
DE LA DIFERENCIACIÓN 


(a) Intensidad media bajo reforzamiento diferenciado a 50 gramos. (b) Cambio de 
intensidad durante la extinción. (c) Curva de extinción usual dada por la tasa de 
respuesta. Las mismas coordinadas que antes. La curva de la rata A dura 65 minu- 
tos; la de la rata B dura 70 minutos. Las flechas muestran los puntos correspon- 
dientes en las dos curvas. Al principio de la extinción no se oía el ruido de los 
almacenes. Empezaron a funcionar en M (aunque estaban vacíos). La rata B pier- 
de la diferenciación de la intensidad antes de que haya ocurrido un descenso de 
tasa muy significativo 
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LA EXTINCIÓN DESPUÉS DE LA DIFERENCIACIÓN 


Ya he mencionado dos características del cambio de presión duran- 
te la extinción: un aumento inicial de presión, seguido por un descenso 
hasta un valor muy bajo. En la figura 108 doy dos ejemplos de ello. 
Los registros breves de (a) muestran la presión media que se obtiene 
bajo reforzamiento diferencial a 50 gramos. La diferenciación sólo se 
había realizado durante unos pocos días. Los registros de (b) muestran 
el curso del cambio de presión al día siguiente en que no se reforzó nin- 
guna respuesta. Al principio del experimento los almacenes estaban 
desconectados; en M se conectaron, pero estaban vacíos. La curva de 
extinción usual dada por el cambio de tasa (ver capítulo 3) también se 
muestra en cada caso en (c). Los puntos correspondientes de las dos 
curvas se han unido con flechas. Es característico de la curva de pre- 
sión que se desarrolle rápidamente una presión media alta. En el caso de 
la rata A persiste una presión elevada durante unas veinticinco res- 
puestas, en el caso de la rata B sólo durante seis. La baja presión últi- 
mamente alcanzada es la más baja observada para cada rata. Cuan- 
do se conectaron los almacenes para producir el sonido reforzante usual, 
se obtuvo un aumento de tasa tal como se describe en el capítulo 3. 
El hecho de que la segunda curva no sea del mismo orden que la pri- 
mera puede deberse, en parte, a que el sonido del quimógrato registra- 
dor de la presión pudo ser oído por la rata en cada respuesta y hasta 
cierto punto confundido con el sonido del almacén. El aumento de 
tasa debido al sonido del almacén propiamente dicho va acompañado 
por un aumento de presión en el registro Ab y en el registro Bb su efec- 
to es nulo. 

Durante la extinción tanto la presión como la tasa empiezan en va- 
lores altos y terminan en valores bajos. Pero, aparte de ello, no existe 
una relación simple entre las mismas. En la figura 108 la caída de la 
presión coincide con bastante exactitud con la caída de la tasa, pero 
ningún aumento de presión acompaña la aceleración de la tasa cuando 
se conecta el almacén. En la figura 108 B el descenso de presión más 
importante tiene lugar mucho antes de que la tasa haya disminuido 
apreciablemente, pero el incremento de tasa cuando se desconecta el 
almacén va acompañado por un aumento de presión. En general, la 
evidencia indica que el cambio de presión durante la extinción es re- 
lativamente independiente de la tasa. 

La baja presión final desarrollada en este proceso evidentemente 
se asemeja a la observada en la extinción antes de la diferenciación (ver 
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figura 102). La similitud sugiere que normalmente ocurre cierta dife- 
renciación de presión aun cuando “todas las respuestas produzcan re- 
forzamiento”. El reforzamiento normal se hace contingente al descenso 
de la palanca aproximadamente en el punto medio de su recorrido. Pero 
la rata puede emitir respuestas que no lleguen a alcanzar este punto, 
como puede observarse fácilmente cuando se ha condicionado primero 
la respuesta. Estas respuestas débiles incompletas constituyen una de 
las causas de las irregularidades registradas en las curvas de condicio- 
namiento. Así, pues, se da cierto reforzamiento diferencial en el expe- 
rimento ordinario. Sólo son reforzadas las respuestas que son lo bastante 
fuertes para hacer descender la palanca hasta el punto requerido. 
En la figura 102 esta diferenciación incidental es probablemente res- 
ponsable de la presión excesiva de la serie C, que se desarrolla a la cuar- 
ta o a la quinta respuesta y, en menor medida, a lo largo de la 
línea-base en los demás casos. La evidencia en favor de la diferenciación 
radica principalmente en el hecho de que la presión final en la extin- 
ción es más baja que la presión normal y de que algunas respuestas fuer- 
tes ocurren, generalmente, en la extinción que no sigue a la diferen- 
ciación explícita. 

Si es cierto que siempre se establece cierta diferenciación y que des- 
aparece durante la extinción, es posible que el fin de la curva de ex- 
tinción normal dada por la rata implique, para ser estudiado nuevo 
instrumental y que la rata emita respuestas débiles incompletas que 
no son registradas. Esto podría comprobarse fácilmente observando a 
la rata, pero se ve controvertido por la naturaleza de los contactos he- 
chos por la rata al final de la extinción. Nunca he observado ninguna 
indicación de que el contacto de la palanca no se haya producido de 
forma completa, excepto en el primer día del condicionamiento. La 
duración del contacto no cambia considerablemente durante la extin- 
ción. Como posible explicación cabe advertir que la estimulación pro- 
pioceptiva de apretar la palanca adquiere un valor reforzante que 
persiste aun cuando el almacén está desconectado. Puede ser suficiente 
para impedir la reducción de la intensidad de la respuesta hasta un 
punto en que falle el aparato registrador. 

Las curvas de la figura 108 son representativas de la extinción sólo 
después de pequeñas cantidades de diferenciación (2-4 días). Cuando 
se mantiene la diferenciación durante períodos del orden de 10-15 días, 
el descenso de la presión se ve muy retardado. Las curvas de presión, 
después de diferenciación prolongada, muestran un aplanamiento hacia 
el final, e incipientes aplanamientos en otros puntos con una tendencia 
a fluctuar entre períodos de alta y baja intensidad. Las curvas dadas 
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por el cambio de tasa también se ven considerablemente alteradas por 
la diferenciación, pero ello probablemente puede explicarse por el orden 
del reforzamiento durante la diferenciación. Como siguen provocándo- 
se muchas respuestas débiles que no son reforzadas, se da un recondi- 
cionamiento periódico irregular con cierta semejanza con el reforzamien- 
to a una razón fija. Por lo tanto, es difícil decir si la diferenciación de 
la presión tiene un efecto sobre la reserva, aunque la evidencia proba- 
blemente va en contra de esta posibilidad. Las curvas de extinción ob- 
tenidas después de una ligera diferenciación no muestran efecto alguno 
y las obtenidas después de una diferenciación prolongada todavía tie- 
nen la magnitud que cabe esperar del reforzamiento irregular. 


De la misma manera que la curva de extinción normal puede utili- 
zarse para detectar la presencia de respuestas reservadas después de 
largos períodos de “desuso” (ver capítulo 3), la curva de presión du- 
rante la extinción puede usarse para detectar la supervivencia de la 
diferenciación cuando por algún tiempo el reforzamiento no ha sido 
condicional a la intensidad. Por ejemplo, después de desarrollar una di- 
ferenciación, reforcemos las respuestas durante varios días sin limita- 
ción. Como el cambio original de intensidad tiene lugar rápidamente, 
sería difícil medir la cantidad de diferenciación remanente restaurando 
simplemente las condiciones requeridas. Pero extinguiendo la respues- 
ta, la diferenciación puede hacerse manifiesta en la curva de presión. La 
figura 109 presenta la curva de extinción de una rata que había des- 
arrollado una diferenciación de 65 gramos y que durante seis días había 
recibido 40 reforzamientos diarios independientemente de la presión 
ejercida. En el día representado en la figura, se reforzaron primero diez 
respuestas sin tener en cuenta la presión. Entonces se desconectó el 
almacén. La curva de tasa (B) muestra considerable variación cíclica, 
pero, aparte de esto, es normal. La curva de presión muestra muy cla- 
ramente la variación alternativa de presión, característica de la extinción 
después de diferenciación prolongada. Se produce una reducción gra- 
dual de la presión media durante la hora. De este registro puede infe- 
rirse que el efecto de la diferenciación ha sobrevivido durante los seis 
días en que se ha utilizado. Podría utilizarse el mismo procedimiento 
cuando no se produce ninguna respuesta en absoluto y cuando el pe- 
ríodo intermedio es lo bastante grande para esperar que ocasione “ol- 
vido”. 
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TIEMPO (UNA HORA) 


Ficura 109 


EXTINCIÓN DESPUÉS DE DIFERENCIACIÓN PROLONGADA SEGUIDA POR UN PERÍODO 
DE NO DIFERENCIACIÓN 


La curva A empieza con diez respuestas reforzadas independientemente de su in- 
tensidad. Seguidamente se produce la extinción. La curva B viene dada por la 
tasa de respuesta con las mismas coordinadas que antes 


REFORZAMIENTO DIFERENCIAL PERIÓDICO 


Cuando se refuerzan periódicamente las respuestas por encima de 
un valor determinado, muchas respuestas por encima de este valor no 
son reforzadas. Sin embargo, la intensidad media de la respuesta sube 
rápidamente y se mantiene alrededor del mismo valor como si todas 
las respuestas por encima de dicho valor fueran reforzadas. En la figu- 
ra 110 (pág. 340) reproducimos un conjunto de registros típicos. Los pe- 
ríodos diarios de una hora son delimitados por líneas rectas. A causa del 
gran número de respuestas, la intensidad se registró empleando coor- 
denadas reducidas. No se redujeron de forma proporcional las unidades 
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de los dos ejes, y la pendiente resultante es algo mayor con cada inten- 
sidad. El cambio relativo de intensidad será, en este momento, suficiente 
para nuestros propósitos. El primer día de la figura muestra la tasa 
normal bajo recondicionamiento periódico a intervalos de cinco minu- 
tos y la intensidad normal media. Al segundo día la rata recibió dos 
reforzamientos independientemente de la presión ejercida, pero, a par- 
tir de este punto, sólo se reforzaron las respuestas por encima de 25 gra- 
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Ficura 110 


INCREMENTO DE LA INTENSIDAD MEDIA CUANDO SÓLO SON PERIÓDICAMENTE 
REFORZADAS LAS RESPUESTAS POR ENCIMA DE UN VALOR DETERMINADO 


Las pendientes de la curva de intensidad son un poco más altas que en las cali- 
braciones anteriores 


mos. Como promedio se reforzó una respuesta cada cinco minutos, 
aunque fue necesario que el intervalo variara algo para obtener res- 
puestas de la presión requerida. Al tercer día la intensidad requeri- 
da se elevó a 80 gramos. La diferenciación no surte ningún efecto sobre 
la tasa, pero la intensidad media aumenta mucho, como en el caso del 
reforzamiento de todas las respuestas por encima del valor requerido. 
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EL REFORZAMIENTO DIFERENCIAL 
DE LAS RESPUESTAS DÉBILES 


Vamos a mencionar ahora otro problema que se plantea en la dife- 
renciación de la intensidad de una respuesta. ¿Puede adiestrarse a una 
rata a apretar la palanca con una presión por debajo de un valor dado? 
La cuestión es difícil de responder experimentalmente por diversas ra- 
zones. La presión normal está tan cerca del valor mínimo requerido 
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RESPUESTAS 


Ficura 111 


REFORZAMIENTO DIFERENCIAL DE LAS RESPUESTAS ALTERNATIVAMENTE POR ENCIMA 
Y POR DEBAJO DE VALORES CRÍTICOS 


para pulsar la palanca que sólo es posible un escaso cambio en dirección 
negativa. El aparato de que disponemos es demasiado tosco para abor- 
dar el problema dentro de una gama tan estrecha. La otra posibilidad 
sería diferenciar hacia abajo después de realizar una diferenciación ha- 
cia arriba. Varios factores operan en contra de un resultado simple. 
Cuando se establece primero el reforzamiento diferencial de las res- 
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puestas débiles, una respuesta no reforzada automáticamente aumenta 
la presión, con lo cual es menos probable que las respuestas siguientes 
sean reforzadas. A ello sigue una extinción considerable y es sólo cuan- 
do la curva de presión de la extinción se ha empezado a aplanar que 
Ocurren de nuevo respuestas lo bastante débiles para ser reforzadas. 
Este reforzamiento fortalece la respuesta ligeramente y todo el proceso 
debe repetirse de.nuevo. Cuando la diferenciación hacia arriba es lige- 
ra, se obtiene un cambio más rápido a una potencia media baja, pero 
de nuevo es difícil decir si se ha establecido una verdadera diferencia- 
ción. En la figura 111 (pág. 341) reproducimos registros representativos 
de tres ratas. El reforzamiento se cambió frecuentemente de más 40 gra- 
mos a menos 25 gramos, tal como viene indicado. Hay una escasa dife- 
rencia entre los ajustes de presión hacia arriba y hacia abajo. Pueden 
ser rápidos o lentos, seguramente de acuerdo con el orden accidental 
del reforzamiento en cada caso. 


Diferenciación de la duración 


El proceso de diferenciación de la duración de una respuesta es 
semejante, bajo muchos aspectos, al de la diferenciación de la intensi- 
dad. Sólo se plantea un nuevo problema con las duraciones más largas. 
Al apretar la palanca con intensidades diversas, al parecer sólo se ve 
involucrado un reflejo. Sin duda alguna, hay unas cuantas diferencias 
topográficas entre las respuestas fuertes y débiles, pero, con fines des- 
criptivos (especialmente con respecto a la reserva), nos estamos refi- 
riendo, esencialmente, a una sola unidad de conducta. Al apretar la pa- 
lanca y al mantenerla hacia abajo durante un período de tiempo 
determinado, no obstante, hay dos respuestas, las cuales son topográ- 
ficamente diferentes por completo. En las duraciones más largas entran 
en conflicto entre sí y producen un efecto que no se presenta en el 
caso de la intensidad. 

El desarrollo original de la diferenciación sigue el curso ya descrito 
para la intensidad. En la figura 112 los dos registros de A son típicos 
de la baja duración media cuando se refuerzan todas las respuestas. 
Cuando se suspende el reforzamiento, las respuestas siguientes son, oca- 
sionalmente, de una duración mayor. No poseemos curvas de extinción 
comparables a las de la intensidad, pero en la parte B de la figura 112 
damos dos registros típicos de la duración cuando se refuerzan y no 
se refuerzan, alternativamente, grupos de cuatro respuestas. La apari- 
ción de respuestas más largas que muestra el registro permite el refor- 
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zamiento diferencial de las respuestas de tres a cinco segundos de du- 
ración. El efecto del reforzamiento diferencial en el sentido de desarrollar 
una duración media mayor viene mostrado en la parte C de la figura, 
en donde reproducimos registros de tres ratas. Tal como indicamos se 
reforzaron las respuestas de cuatro, cuatro y cinco segundos de dura- 
ción. Todas las respuestas reforzadas vienen indicadas por medio de 
puntos. La tasa de aumento de la duración media es comparable con 
la ya descrita para la intensidad. 


Ficura 112 


DIFERENCIACIÓN DE LA DURACIÓN DE LA RESPUESTA 


A: duraciones normales, todas las respuestas reforzadas. B: aparecen respuestas 

largas cuando no se refuerzan grupos alternativos de cuatro respuestas. C: aumento 

de la duración media cuando se refuerzan diferencialmente las respuestas por en. 
cima de una duración crítica. Registros correspondientes a tres ratas 


Cuando se intentan hacer diferenciaciones en los valores extremos 
de la duración, aparece un efecto especial. El reforzamiento diferen- 
cial de las respuestas de presión elevada produce respuestas cuyas inten- 
sidades se distribuyen con mucha aproximación alrededor del valor 
requerido. En el caso de la duración tiende a haber dos clases de res- 
puestas: de corta y larga duración. Las respuestas cortas ocurren en 
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grupos y generalmente al principio del experimento. Las respuestas de 
duraciones intermedias son raras y se diseminan a lo largo de todo el 
registro, 

En la figura 118 mostramos una serie de registros consecutivos bajo 
reforzamiento diferencial a 12 segundos. La rata había avanzado de 
dos a doce segundos a lo largo de los siete días anteriores, siendo re- 
forzadas veinticinco respuestas cada día. El primer registro de la fi- 


SEGUNDOS 
POR RESPUESTAS 


RESPUESTAS 


Ficura 113 


La DURACIÓN BAJO REFORZAMIENTO DIFERENCIAL DE LAS RESPUESTAS DE DOCE 
SEGUNDOS DE DURACIÓN 


Nótese la tendencia a empezar cada período diario con respuestas cortas 


gura se asemeja al registro de intensidad en la distribución de las res- 
puestas adecuadas e inadecuadas. A medida que la diferenciación se 
va haciendo más eficiente, las respuestas cortas se vuelven más cortas 
y se van agrupando, generalmente cerca del principio del período. Al 
término de esta serie de registros, en que la diferenciación está bien 
establecida, ocurren muy pocas respuestas cortas. 

Después de la serie registrada en la figura 113, se fue avanzando 
la diferenciación por etapas de tres segundos cada tres días. Los grupos 
de respuestas cortas se hicieron más pronunciados a medida que la 
duración aumentaba. En la figura 114 damos tres registros a los 27 se- 
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gundos. Hay algunas respuestas cortas intermedias mezcladas con las 
largas, pero la principal característica del registro es el grupo de res- 
puestas muy cortas al principio de cada registro o cerca del mismo. 
En esta figura también damos las curvas de tasa. La rata empieza cada 
período respondiendo muy lentamente. De esas respuestas lentas, una 
o dos de ellas pueden ser largas. Luego se produce un período de res- 
puesta muy rápida, cuando todas las respuestas son muy cortas. Final- 
mente, empiezan a aparecer regularmente las respuestas largas. Por su- 
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SEGUNDOS POR RESPUESTAS 


RESPUESTAS 
Ficura 114 


Duración BAJO REFORZAMIENTO DIFERENCIAL DE LAS RESPUESTAS 
DE VEINTISIETE SEGUNDOS DE DURACIÓN 


Corresponde a la parte más avanzada de la serie de la figura 113. Se han añadido 

las curvas de tasa y se han conectado con flechas los puntos correspondientes con 

las curvas de duración. Nótese el ulterior desarrollo de grupos de respuestas cor- 
tas al principio de los registros 


Puesto, la tasa esta vez está limitada por la duración de cada respuesta, 
Después de los tres días mostrados en la figura 114 se aumentó la 
duración requerida hasta 30 segundos. Aunque el incremento relativo 
fue ligero, la conducta de la rata se vio considerablemente afectada. La 
figura 115 (pág. 346) abarca cinco días. Los grupos de respuestas cortas 
aparecen aún, pero empiezan a ocurrir en el cuerpo de la curva. La 
relación existente entre la tasa y la duración puede verse gracias a 
las dos curvas de tasa incluidas en la figura y conectadas con flechas 
con las curvas de duración. 
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Sólo en una ocasión una curva de presión sugirió un agrupamiento 
similar de respuestas débiles. En general, la curva típica para un valor 
extremo de intensidad (ver figuras 103 y 104) se ve libre de este efecto. 
La explicación de la diferencia parece ser que al llegar a mantener la 
palanca apretada hacia abajo durante un período de tiempo determina- 
do, la rata se enfrenta al conflicto entre la respuesta de mantenerla ha- 
cia abajo y la respuesta de apretarla de nuevo. El hecho de seguir 


RESPUESTAS 


Ficura 115 


La DURACIÓN BAJO EL REFORZAMIENTO DIFERENCIAL DE LAS RESPUESTAS 
DE TREINTA SEGUNDOS DE DURACIÓN 


Continuación de la serie de las figuras 113 y 114. Las dos curvas de tasa también 
vienen reproducidas. Ahora aparecen grupos de respuestas cortas en el cuerpo 
de las curvas 


manteniendo la palanca hacia abajo es incompatible con el hecho de 
emitir una Segunda respuesta, pero tanto el acto de la pulsación como 
el acto de mantener apretada la palanca son reforzados y coexisten con 
una fuerza considerable. La respuesta de simplemente apretar la palan- 
ca existe con una fuerza que exige su provocación más frecuentemente 
de lo que permitiría la duración requerida. Según esta interpretación, 
una respuesta larga sólo puede ejecutarse cuando la respuesta de apre- 
tar es lo bastante débil como para no originar un conflicto. La debili- 
dad requerida se obtiene con la rápida provocación de respuestas cor- 
tas, las cuales no son reforzadas. Sólo en el momento en que se ha 
“desembarazado de un cierto número de pulsaciones”, la rata puede con- 
tinuar manteniendo la palanca hacia abajo el tiempo suficiente para 
lograr un reforzamiento. La situación, probablemente, también implica 
el reforzamiento de la “no-respuesta”, un problema que merece inves- 
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tigarse separadamente, pero que de momento he dejado para otra oca- 


sión. Este reforzamiento puede explicar la baja tasa de respuesta inicial 
de cada día. 


Si la interpretación del resultado típico en la diferenciación de la 
duración como el efecto de un conflicto entre apretar la palanca y man- 
tenerla hacia abajo es correcta, tiene que ser posible alterar el equilibrio 
de las dos fuerzas cambiando el impulso. La respuesta de mantener la 
palanca hacia abajo implica una discriminación temporal. Pero la me- 
dida de cualquier discriminación que dependa de la razón entre las 
respuestas “correctas” y las “incorrectas” o de la prepotencia de una 
de las dos respuestas en conflicto, se verá afectada por el estado del 
impulso existente en aquel momento. La demostración de Pavloy de 
que un “reflejo de huella” (interpretado como una discriminación tem- 
poral en el capítulo 7) es sensible al impulso ya ha sido mencionada. 
En el presente caso, si se reduce el impulso, la tendencia a empezar 
Una nueva respuesta debiera debilitarse y con ello tendría que permitir- 
se a la rata mantener la palanca hacia abajo durante períodos más lar- 
gos. Un pequeño experimento sobre este punto sugiere que es eso lo 
que sucede. Se sometieron a prueba dos ratas que habían sido reforza- 
das diferencialmente a ocho segundos. La medida de la diferenciación 
se estimó contando el número de respuestas demasiado cortas emitidas 
en el curso de ejecutar 20 respuestas suficientemente largas. Los cálcu- 
los abarcaron trece días. Durante seis de ellos las ratas se mantuvieron 
al impulso normal, siendo el número medio de respuestas demasiado 
cortas hechas por cada rata de 26 y 21, respectivamente. Hubo días es- 
paciados en que se redujo el impulso dándoles de comer dos o cuatro 
gramos de comida (ver capítulo 10). En el primer día, cada rata recibió 
dos gramos de comida y el efecto fue principalmente ocasionar una 
perturbación en el nuevo procedimiento. Los días restantes las ratas 
recibieron cuatro gramos. El número medio de las respuestas demasia- 
do cortas durante los días de cuatro gramos se redujo, junto con el im- 
pulso, a 13 y 12, respectivamente. 


Este experimento es demasiado simple y, por ello, lo único que 
permite es sugerir que la aparición de las respuestas cortas puede verse 
afectada por el impulso de una forma que está de acuerdo con la inter- 
pretación del proceso que implica un conflicto entre la respuesta de 
mantener apretada la palanca y la respuesta de pulsarla de nuevo. 


La interpretación del conflicto entre mantener la palanca hacia abajo 
y emitir otra respuesta se ve corroborada más adecuadamente por la 
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evolución de la duración cuando se extingue la respuesta, por lo cual 
vamos a considerar esta posibilidad. 


SEGUNDOS POR RESPUESTA 


Ficura 116 


EXTINCIÓN DEPUÉS DE UN INCREMENTO GRADUAL DE LA DIFERENCIACIÓN DE 
LA DURACIÓN 


La curva superior de cada par dura una hora y viene dada por la tasa de respuesta 

(las mismas coordenadas que antes). Las curvas inferiores dan la duración. Entre 

cada día de extinción se intercalaron tres días de reforzamiento diferencial a cua- 
tro segundos 
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EXTINCIÓN DESPUÉS DE LA DIFERENCIACIÓN 
DE LA DURACIÓN 


En las figuras 116 y 117 reproducimos una serie de curvas de extin- 
ción correspondientes a una sola rata después de una diferenciación cada 
vez más amplia. Los registros de A se obtuvieron después de un día de 


SEGUNDOS POR RESPUESTAS 


Ficura 117 
EXTINCIÓN DESPUÉS DE UNA AVANZADA DIFERENCIACIÓN DE LA DURACIÓN 


Estas curvas constituyen la continuación de la serie de la figura 116. Cada ex- 

tinción fue precedida por una prolongada diferenciación a ocho segundos. Nótese 

la aceleración positiva de las curvas de duración y el carácter normal de las curvas 
proporcionadas por la tasa 
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diferenciación, durante el cual se reforzaron 20 respuestas de tres se- 
gundos de duración. La curva superior registra las respuestas, la inferior 
la duración. Durante la extinción aparecen unas cuantas respuestas lar- 
gas. Entre las curvas de A y las de B se intercalaron tres días de diferen- 
ciación, en que se reforzaron 20 respuestas cada día a uma duración 
de cuatro segundos. Entre B y C y entre C y D, asimismo, se intercaló 
la misma cantidad de diferenciación. Las curvas dadas por las respues- 
tas, representadas con respecto al tiempo, muestran una reducción pro- 
gresiva en el área, como sucede generalmente con la extinción repetida, 
y las curvas de duración muestran un ligero incremento de la duración 


SEGUNDOS POR RESPUESTAS 


Ficura 118 
EXTINCIÓN DESPUÉS DE LA DIFERENCIACIÓN DE LA DURACIÓN 


Todas las respuestas produjeron el sonido del almacén vacío al cabo de cuatro 
minutos 


media. Sin embargo, el efecto de esta cantidad de diferenciación es 
escaso. La extinción registrada en D fue seguida por dos días a cuatro 
segundos y tres días a ocho. El apartado E de la figura 117 mues- 
tra la extinción subsiguiente. La curva de tasa es del mismo orden, pero 
la curva de duración muestra una pendiente media considerablemente 
mayor y una acusada aceleración positiva. Las curvas de F se tomaron 
después de 16 días de ulterior diferenciación a ocho segundos. La du- 
ración media se incrementó más, mientras que la curva de tasa conser- 
vó la misma forma y tamaño generales. 

La serie de experimentos registrada en esas dos figuras muestra, 
ante todo, que la diferenciación no surte efecto alguno sobre la reser- 
va, ya que la forma y el tamaño de la curva de extinción no se ven 
considerablemente afectados. Estos experimentos muestran también que 
la duración media durante la extinción está en función del grado en 
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que se ha realizado la diferenciación. Una diferenciación de ocho se- 
gundos produce una duración media mayor durante la extinción que 
una de cuatro segundos, Finalmente, como confirmación de la noción 
de conflicto antes propuesta, la aceleración positiva de las curvas de 
duración indica que la rata es capaz de mantener la palanca hacia abajo 
durante períodos más largos cuando la respuesta de apretar la palanca 
es más débil, es decir, hacia el final de la extinción. 


SEGUNDOS POR RESPUESTAS 


Ficura 119 
EXTINCIÓN DESPUÉS DE AVANZADA DIFERENCIACIÓN DE LARGAS DURACIONES 


Las curvas son de 85 minutos de duración. La extinción se obtuvo después de la 
larga serie que concluye en la figura 115. Adviértase la presencia de respuestas 
de más de un minuto de duración, así como de grupos de respuestas muy cortas 


Otra forma de extinguir el reflejo después de la diferenciación es 
permitir que se oiga el sonido del almacén al final de un intervalo dado, 
pero no administrar comida. El sonido, generalmente, hace terminar la 
respuesta en el momento escogido, y no se observa tendencia alguna a 
incrementar la duración a medida que el reflejo se debilita. En la fi- 
gura 118 damos una curva típica. Se había llevado a cabo un reforza- 
miento diferencial, durante un día, a dos segundos, y durante tres días 
a cuatro segundos. En el día registrado en la figura cada respuesta de 
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cuatro segundos de duración produjo el sonido del almacén, pero no 
se administró comida alguna. Si es que se llega a emitir alguna respues- 
ta, generalmente se prolonga hasta que suena el almacén. 

Tras haber alcanzado duraciones extremadamente largas, la curva 
de extinción es completamente irregular. Ocurren grupos de respuestas 
cortas y rápidas, similares a cuando se proporciona reforzamiento di- 
ferencial, y también se obtienen duraciones excepcionalmente largas. 
En la figura 119 (pág. 351) reproducimos la curva después de la dife- 
renciación mostrada en la figura 115, Pueden observarse varias respuestas 
de más de un minuto de duración, aunque la máxima duración refor- 
zada fue sólo de treinta segundos. También son evidentes los grupos 
de respuestas muy cortas característicos de la figura 115. La lenta res- 
puesta inicial desarrollada durante la diferenciación es observable al 
principio de la curva de extinción correspondiente a las respuestas con 
respecto al tiempo (B), aunque la última parte de la curva es normal 
por la cantidad y la frecuencia de reforzamiento que la han precedido. 
La curva de la duración no muestra la aceleración positiva característi- 
ca de la extinción después de una diferenciación menor, pero pese a 
las respuestas muy largas de la primera parte de la curva, no se produce 
ningún aplanamiento comparable al observado en el caso de la inten- 


sidad. 


Discriminación y diferenciación combinadas 


Al decir que la diferenciación de la respuesta tiene lugar indepen- 
dientemente de la estimulación discriminativa, no estamos implicando 
que no pueda establecerse una relación entre estos dos acontecimien- 
tos. En la vida ordinaria del organismo la determinación de la intensidad 
de una respuesta depende, a menudo, de los estímulos discriminativos. 
Levantamos un objeto con una potencia más o menos proporcional a 
su tamaño antes de que el peso del objeto nos haya estimulado, como 
es fácilmente observable en la ilusión del tamaño-peso. La conducta 
muestra una doble discriminación. En presencia de un estímulo discri- 
minativo dado se refuerza una respuesta por encima de una intensidad 
crítica. En presencia de otro estímulo, la respuesta puede ser regida por 
otra intensidad crítica. Un paralelo experimental podría ser el caso en 
que, en presencia de una luz, sólo se reforzaran respuestas por encima 
de una presión determinada, mientras que en ausencia de la luz cual- 
quier respuesta o sólo las respuestas por debajo de una presión deter- 
minada fueran reforzadas. Este caso aún no ha sido sometido a prueba. 
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Esta operante discriminada y diferenciada se representaría sSP.RD en 
que el reforzamiento es condicional a ambas D. 


Conclusión 


Las diferenciaciones topográficas y cuantitativas de la respuesta son 
claramente distintas de la discriminación sensorial. Aun cuando supon- 
gamos que para cada forma identificable de respuesta existe un estímu- 
lo interno o externo específico exclusivamente correlacionado con ella, 
es imposible forzar los hechos descritos en este capítulo con objeto de 
encajarlos en las fórmulas del capítulo 5. La diferencia se hace más 
clara cuando se recuerda el carácter no-provocativo de la conducta 
operante. Entre la diferenciación topográfica y cuantitativa existen, 
asimismo, varias importantes diferencias. Tanto en el caso de la inten- 
sidad como en el de la duración, las diversas formas a partir de las cua- 
les se puede hacer una elección diferencial se sitúan en un continuo. 
La interacción entre ellas es relativamente simple y sólo se ve involu- 
crada una reserva. Pero es difícil decir hasta dónde se puede llevar 
una diferenciación topográfica antes de que nos encontremos con re- 
servas adicionales. Youtz (82) ha estudiado la interacción de las ope- 
rantes que poseen muchos puntos comunes desde el punto de vista 
topográfico. Cuando se condiciona a una rata para que apriete una 
palanca vertical u horizontal mediante reforzamientos de comida, Youtz 
halla que la extinción de la respuesta a una palanca hace disminuir 
el número de respuestas de la curva de extinción de la otra en un 63 %. 
Este caso topográfico implica, sin duda alguna, dos reservas. 

Tanto la diferenciación topográfica como la cuantitativa siguen la 
regla del condicionamiento operante original según la cual, si queremos 
que la diferenciación o el condicionamiento tenga lugar, una respuesta 
de la forma requerida debe ya existir antes del reforzamiento. Las for- 
mas O valores extremos sólo pueden obtenerse mediante aproximacio- 
nes sucesivas. Cuando una sola propiedad, como la intensidad, constitu- 
ye la base de la diferenciación, el proceso puede representarse de la 
forma siguiente: Originalmente, las respuestas se emiten con sus inten- 
sidades distribuidas (por ejemplo, normalmente) alrededor de un valor 
bajo. El reforzamiento de los miembros de la parte superior de la gama 
hace variar la media hacia arriba y, con ella, la curva entera. Entonces 
se pueden reforzar las respuestas de la parte superior de la nueva 
gama y así sucesivamente. 

El caso topográfico no se representa de forma tan simple, pero, una 
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vez más, las formas extremas de respuesta se alcanzan sólo a través de 
una serie de etapas. Los domadores de animales están familiarizados 
con este método. Realizando un tour de force he entrenado a una rata 
para que ejecutara una serie elaborada de respuestas sugeridas por los 
recientes trabajos sobre monos antropoides. La conducta consiste en 
tirar de una cadena para alcanzar una canica situada en un estante, co- 
ger la canica con sus patas delanteras y transportarla hasta un tubo cuya 
boca está a dos pulgadas de altura del suelo de la jaula, meter la ca- 
nica dentro del tubo y dejarla caer. Cada etapa del proceso tuvo que 
elaborarse a través de una serie de aproximaciones, puesto que las res- 
puestas componentes no estaban en el repertorio original de la rata. 


Los datos sobre la intensidad de la respuesta arrojan luz sobre una 
de las distinciones entre la conducta operante y respondiente. En una res- 
pondiente, la intensidad de la respuesta viene determinada por la 
intensidad del estímulo y no es posible ninguna diferenciación de la res- 
puesta. La intensidad de la respuesta a un estímulo constante constitu- 
ye una medida directa de la fuerza del reflejo. En la conducta operante 
los cambios de intensidad que ocasionen cambios en la fuerza del re- 
flejo son escasos o tal vez nulos. En la figura 102 el ligero incremento 
de la intensidad durante la extinción casi completa se debe probable- 
mente a la diferenciación incidental de la intensidad que resulta de 
la tensión inicial de la palanca. En todo caso, el cambio es mucho me- 
nor que el cambio de fuerza dado por la tasa. La intensidad de la res- 
puesta en la operante es significativa sólo en relación con la historia 
diferenciativa del organismo y ello puede explicar el fracaso de muchos 
intentos de aplicar las técnicas respondientes a la conducta operante. 


1. En el número de Life de 31 de mayo de 1937 apareció un artículo de 
vulgarización sobre esta rata, ilustrado con fotografías. 
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9, El impulso 


Los cambios característicos en la fuerza de un reflejo, hasta ahora 
descritos, se han asociado con la operación llamada reforzamiento. Los 
procesos de condicionamiento, extinción, discriminación y diferencia- 
ción, en sus muchas formas, surgen de las diversas maneras en que un 
estímulo reforzante puede estar relacionado con la conducta. Es evi- 
dente que el reforzamiento es una de las operaciones importantes que 
modifican la fuerza del reflejo. Otro tipo de operación quizás igual- 
mente importante está asociada con el problema tradicional del impul- 
so o motivación, al que vamos a consagrar este capítulo y el siguiente. 

La noción de impulso que vamos a proponer aquí es algo más res- 
tringida en su ámbito que la concepción tradicional, que ha abarcado 
una gran variedad de fenómenos. En un extremo, el “impulso” se con- 
sidera simplemente como la energía básica disponible para las res- 
puestas del organismo; en el otro, se identifica con el “propósito” o 
con alguna representación interna de un objetivo. En la obra de 
Young (81) podemos hallar un examen de las muchas concepciones 
hoy día en boga. Afortunadamente, nuestra orientación preliminar fa- 
cilita una formulación más simple del problema y una delimitación 
más precisa del ámbito abarcado. 

El problema del impulso se plantea porque gran parte de la con- 
ducta de los organismos muestra una aparente variabilidad. Una rata 
no siempre responde a la comida que se le coloca ante ella, y como 
posible explicación se invoca el factor del “hambre”. Se dice que la 
rata sólo come cuando está hambrienta. Como el acto de comer no es 
inevitable, nos vemos obligados a formular la hipótesis de un estado 
interno al que podamos atribuir la variabilidad. Cuando no hay va- 
riabilidad, no se precisa ningún estado. Como la rata generalmente 
responde al shock que recibe su pata flexionándola, no se requiere 
ningún “impulso de flexión” comparable al hambre. Las soluciones 
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tradicionales al problema del hambre y de los otros impulsos no nos 
interesan aquí. Como en el caso de la variabilidad de la fuerza del 
reflejo, el problema con que nos enfrentamos es hallar la variable o 
variables de las cuales la fuerza es función y expresar la relación me- 
diante un conjunto de leyes. 


En el ejemplo que acabamos de mencionar podemos, pues, desviar 
nuestra atención de un “estado de hambre” para dirigirla a la conducta 
típica que se dice depender de él, por ejemplo, a la conducta de una 
rata al acercarse a un pedazo de comida, masticarlo y tragarlo. La 
provocación de esta cadena de reflejos no puede predecirse simple- 
mente a partir del conocimiento de las energías estimulantes que sur- 
gen de la situación. Otra de las variables que vamos a considerar es 
el tiempo. Si se somete una rata a control experimental con un sumi- 
nistro de comida, puede averiguarse su programa de ingestión normal. 
Richter (67) ha mostrado que, bajo ciertas condiciones, la rata come 
“con considerable regularidad cada período de 3-4 horas. La demos- 
tración de la periodicidad amplía nuestras facultades predictivas, y se 
han realizado hallazgos semejantes en otros tipos de conducta, como 
por ejemplo, la sed, el sexo, la actividad, etc. 


Como mínimo se pueden llevar a cabo dos nuevos progresos en 
esta dirección. La demostración de un “ciclo” o “periodicidad” cons- 
tituye un suplemento inadecuado al conocimiento de la situación esti- 
mulativa porque la variable de la cual la conducta es función no es 
simplemente el tiempo, sino la ingestión de la comida y el transcurso 
del tiempo después de dicha ingestión. La periodicidad es incidental : 
una rata no come continuamente y, por lo tanto, debe comer periódi- 
camente. Es cierto que la regularidad del proceso sugiere una causa 
sometida a leyes, pero ello de por sí no nos dice mucho acerca de la 
relación real de la fuerza de la conducta con la operación de la cual 
es función. No podemos mejorar el valor predictivo de un ciclo de 
hambre refinando nuestras mediciones del tiempo, pero podemos in- 
tentar llegar a controlar mejor la variable importante, que es la can- 
tidad de la comida ingerida. Keller ha realizado experimentos similares 
a los de Richter en los que se midieron las cantidades de alimento 
ingeridas en cada período, así como la tasa de ingestión, experimentos 
a los que me voy a referir más adelante. 


La segunda mejora posible sobre el mero registro de un ciclo con- 
siste en reorganizar no simplemente la presencia o la ausencia de la 
conducta de ingestión, sino los diversos grados de fuerza que puede 
presentar la conducta. La simple observación de si una rata come o no 
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es una medida absoluta, pero nuestro uso común del término hambre 
indica que es necesaria una medida que tome en consideración el grado 
del mismo. 

El problema puede reformularse de la manera siguiente: al estu- 
diar el tipo de conducta que origina el concepto de hambre, nos 
referimos a una cierta clase de reflejos y a las dos principales ope- 
raciones que la afectan, a saber, la alimentación y el ayuno. Como 
la provocación de la conducta de comer generalmente implica la in- 
gestión, la fuerza y la operación que afecta la fuerza se confunden 
fácilmente. Sin embargo, no se plantea ningún problema técnico espe- 
cialmente difícil. Para medir la fuerza de la conducta, pueden utilizarse 
las técnicas ya empleadas en el caso del condicionamiento, mientras 
que las operaciones de alimentación y de ayuno sugieren sus propios 
métodos de medición. 

La fuerza de un reflejo relativo a la ingestión puede variar entre 
dos extremos: es más fuerte después de un prolongado ayuno y es más 
débil después de una ingestión masiva. Si se priva a un organismo de 
comida durante algún tiempo y luego se le permite que coma libre- 
mente, la fuerza pasa de un valor alto a un valor bajo. En los experi- 
mentos que vamos a describir, este cambio se puso en evidencia a base 
de registrar la tasa a la que se ingería el alimento. Esta medida tiene 
dos funciones, pues la tasa constituye a la vez una indicación de la 
fuerza de la cadena de reflejos de que se compone el acto de comer 
y también una medida de la ingestión de la comida, que influye sobre 
la fuerza. 

Se confeccionaron gránulos de comida de un tamaño uniforme (1/15 
gramos) a base de un pienso constituido por harina integral de trigo, 
maíz, copos de avena, semillas de lino, harina de hueso y sal. La tasa 
de ingestión, pues, podía expresarse como la tasa según la cual la rata 
cogía y comía estos gránulos. Esta tasa puede registrarse de la manera 
siguiente: La rata está situada en una plataforma y obtiene los gránu- 
los empujando hacia adelante una compuerta al otro lado de la cual 
hay una cavidad. La compuerta está dotada de un contrapeso de tal 
modo que se abre con facilidad. La comida se halla situada por debajo 
del nivel de la plataforma de manera que la rata deba retirarse del 
comedero antes de ingerirla. Cada vez que se abre la puerta, se cierra 
un contacto eléctrico, el cual se registra de la forma usual. En el mo- 


1. El aspecto de la conducta que cambia durante un cambio de hambre 
es el mismo que en el caso del condicionamiento. Sobre este punto el lector 
puede consultar el capítulo 1, página 40. 
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delo que hemos utilizado, al otro lado de la puerta se hallan dos cavi- 
dades, una de las cuales contiene agua. 

Diariamente, a la misma hora, se sacaba a una rata de su jaula- 
hogar y se la colocaba en la caja experimental con un abundante su- 
ministro de comida y de agua. Ordinariamente la rata se dejaba en 
la caja al menos hasta después de haber transcurrido treinta minutos 
durante los cuales la rata no hubiera ingerido gránulo alguno. Enton- 


GRÁNULOS INGERIDOS 


TIEMPO EN MINUTOS 


Ficura 120? 
CAMBIO DE LA TASA DE INGESTIÓN DURANTE UN PERÍODO DE COMIDA DIARIO 


En cada elevación de la plumilla la rata obtuvo y comió un gránulo de comida. 
Nótese la depresión de la curva y la recuperación siguiente hacia el final del período 


ces, se sacaba a la rata de la caja y se devolvía a su jaula-hogar, donde 
recibía unos cinco gramos de hoja de lechuga seca. No se le adminis- 
traba más comida. 

En la figura 120 reproducimos un registro típico obtenido con este 
procedimiento. Como se puede ver, la tasa de ingestión varía de una 
forma regular, empezando al máximo y disminuyendo regularmente a 
lo largo del período. La curva típica es muy parecida a una parábola. 
Su ecuación es N =Kf" en que N es igual a la cantidad de comida 
ingerida durante el tiempo + contado desde el principio del período y 
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K y n son constantes, El valor de n es aproximadamente de 0.68. En 
la figura 121 damos una curva experimental ajustada con la de esta 
ecuación. El valor de n en esta figura es de-0.70. 

Estas figuras no son excepcionales, Pueden obtenerse diariamente 
curvas de igual regularidad si los experimentos se llevan a cabo con 
las debidas precauciones. El aparato puede ser incapaz de registrar la 
conducta del animal, especialmente cuando ésta es atípica, como, por 
ejemplo, cuando la rata toma un gránulo de comida del comedero, 
lo deja caer, no lo recoge del suelo y vuelve de nuevo al comedero. 


100 


so 


GRÁNULOS INGERIDOS 


30 60 
TIEMPO EN MINUTOS 


Ficura 121 4 


CURVA DADA POR EL CAMBIO DE LA TASA DE INGESTIÓN AJUSTADA SEGÚN 
LA ECUACIÓN CITADA EN EL TEXTO 


En tal caso el aparato registrará dos gránulos ingeridos en vez de uno. 
Los accidentes de este tipo, afortunadamente, son infrecuentes. Tam- 
bién hay irregularidades de la conducta del animal que quedan regis- 
tradas correctamente. Como podemos ver en la figura 120, cerca del 
final de la segunda hora la rata deja de comer y no reanuda su acti- 
vidad hasta después de un intervalo de 20 minutos. Al final del inter- 
valo, la rata, por decirlo así, va retrasada con respecto al ritmo que 
ha venido siguiendo en la primera parte de la curva. Cuando empie- 
za de nuevo, sin embargo, come a una tasa mayor de manera que al 
cabo de media hora el registro ha alcanzado la extrapolación del cuerpo 
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de la curva. La tasa no es constante durante el período de restableci- 
miento, pero cae de una forma muy parecida a la de la curva original. 
Nunca he observado un registro que fuera más allá de la extrapolación 
de la curva principal. Por el contrario, en muchos casos la extrapola- 
ción no se llega a alcanzar por completo. En las figuras 120 y 121 po- 
demos descubrir otros ejemplos menores del mismo fenómeno. 

Las interrupciones mostradas en estos registros pueden explicarse de 
varias formas. Durante algunas de ellas la rata bebe, como hemos lle- 
gado a determinar en virtud de un dispositivo especial conectado al 
recipiente de agua. Los intervalos más largos de la última parte de 
los registros no pueden explicarse de esta forma y tienen que deberse 
a una conducta conflictiva de otro tipo. Son función de la fuerza de 
los reflejos de ingestión (que aumenta a medida que desciende la fuer- 
za) y, por consiguiente, pueden considerarse, plausiblemente, como el 
efecto de estímulos competitivos que llegan a prevalecer sobre la esti- 
mulación de la comida. El aumento compensador que sigue a una inte- 
rrupción se parece a la compensación ya descrita en capítulos anteriores. 

En algunos experimentos relativos al proceso de restablecimiento 
se utilizó un pequeño fuelle que, al hincharse, ejercía presión sobre la 
compuerta de acceso al recipiente de comida. El fuelle era controlado 
desde la habitación contigua y permitía al experimentador cerrar la 
puerta sin necesidad de molestar a la rata. De esta forma se podían 
introducir en un registro intervalos de la duración deseada, durante 
los cuales la rata no comía. En el experimento siguiente los intervalos 
fueron de 10-15 minutos de duración y se introdujeron tan pronto como 
se hubo establecido la tendencia general de la curva o cuando la rata 
había ingerido unos treinta gránulos de comida. 

La figura 122 muestra un registro típico obtenido cuando se utilizó 
por primera vez el sistema de cierre neumático. Por supuesto, la curva 
se interrumpió y, después del intervalo forzoso, la rata comió a una 
tasa superior. La extrapolación de la curva original se alcanzó al cabo 
de veinte minutos. Pero, como se puede ver en la figura 123, en que 
la interrupción duró 13 minutos y nunca se alcanzó la extrapolación, 
ello no siempre sucede así. Las curvas de restablecimiento obtenidas 
de esta forma difieren notablemente de la de la figura 120, como se pue- 
de ver escorzando los registros y examinando las curvas. En las figuras 
121 y 123 el restablecimiento tiene lugar a una tasa aproximadamente 
constante y el registro muestra una ruptura en el punto en que se 
alcanza la curva original. Por otra parte, en la figura 120, el restable- 
cimiento muestra una tasa que disminuye progresivamente y que se 
aproxima a la curva original asintóticamente. 
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Cuando se ha empleado el cierre varias veces, las curvas empiezan 
a adoptar el carácter del restablecimiento normal. Cuando se tomó el 
registro de la figura 124 se habían introducido intervalos forzosos en 
dos ocasiones previas. Aunque podemos discernir una ruptura en el 
punto en que se alcanza la curva original y el restablecimiento es rela- 
tivamente lento, la curva es convexa y sin duda alguna es semejante 


GRANULOS INGERIDOS 


sá PAUSA FORZADA DE 


10 MINUTOS 


30 


TIEMPO EN MINUTOS 


Ficura 122 
AUMENTO COMPENSATORIO DE TASA DESPUÉS DE UNA INTERRUPCIÓN FORZOSA 


En la ruptura horizontal de la curva la rata fue mantenida apartada de la comida 
durante diez minutos. El restablecimiento es bastante lineal y se produce una clara 
ruptura cuando se alcanza la extrapolación de la curva original 


a la curva de restablecimiento normal. Podemos ofrecer una tentativa 
de explicación de este fenómeno en la forma siguiente: El restableci- 
miento en línea recta de la figura 122 es, probablemente, la resultante 
de un restablecimiento normal y de un efecto emocional ocasionado por 
la retirada de la comida. En las ocasiones siguientes el efecto emo- 
cional desaparece, dejando la curva de restablecimiento normal. 

La tendencia hacia el restablecimiento después de cualquier des- 


361 


viación, da un valor suplementario a la envolvente que puede trazarse 
a partir de los puntos más elevados de una curva y, por tanto, a una 
ecuación basada en registros aislados. 

Ello es de agradecer, pues la promediación de curvas de este tipo 
es objetable. Las desviaciones, aparentemente, siempre se sitúan por 
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TIEMPO EN MINUTOS 


Ficura 128 


INCREMENTO COMPENSATORIO DE TASA QUE NO LOGRA ALCANZAR LA EXTRAPOLACIÓN 
DE LA CURVA ORIGINAL 


debajo del curso principal de la curva, y aunque un promedio daría 
una curva más suave, no daría la curva a la que, en realidad, se apro- 
xima la rata. Como, por razones obvias, las desviaciones son más fre- 
cuentes con las fuerzas más bajas, la forma de la curva se vería con- 
siderablemente modificada por el promedio. 

Una curva como la de la figura 120 se da arbitrariamente por con- 
cluida cuando la rata no ha comido durante 30 minutos, pongamos 
por caso. La sección final llana de la curva que representa este período 
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no viene reproducida en las figuras. La rata, una vez saciada, es po- 
sible que no vuelva a comer hasta después de varias horas y, tras una 
pausa tan larga, por supuesto, la compensación no es adecuada para 
hacer volver la curva a la extrapolación de su primera parte. Al consi- 
derar el destino final de esta curva nos enfrentamos a la cuestión de 
su relación con los ciclos de comida periódicos normales descritos por 
Richter. 


GRÁANULOS INGERIDOS 


¿ee PAUSA FORZOSA DE 10 MINUTOS 


TIEMPO EN MINUTOS 


FiGurA 124? 
RESTABLECIMIENTO COMPENSATORIO DESPUÉS DE UNA INTERRUPCIÓN FORZOSA 


La rata se ha adaptado al hecho de verse apartada de la comida y la curva de 
restablecimiento se asemeja mucho más al caso “natural” de la figura 120 


Podemos decir que, a lo largo de un período de tiempo del orden 
de semanas o meses, la tasa media de ingestión es constante, si pasa- 
mos por alto los cambios debidos a la edad. Pero la ingestión realmente 
tiene lugar a lo largo de una serie de períodos diarios, durante los 
cuales la tasa de ingestión no está más cerca de cero que la tasa final 
de la curva de ingestión que acabamos de estudiar y tal vez no tan 
cerca. En una serie de registros que F. S. Keller me ha enviado ama- 
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blemente, la cantidad total de comida ingerida por la rata durante 
24 horas aparece dividida en diez o doce períodos más o menos igua- 
les. (Esta periodicidad no corresponde exactamente a la citada por 
Richter, pero hay muchas diferencias a tener en cuenta, como son: 
la composición de la comida, la temperatura, la humedad, la cepa de 
las ratas, etc.). La tasa de ingestión durante esos breves períodos es 
prácticamente constante y bastante baja. La rata, probablemente, em- 
pieza a comer antes de tener un gran apetito y pronto deja de comer. 

Ahora bien, si introducimos un período de abstinencia forzosa en el 
programa de veinticuatro horas, la “densidad” de la conducta de in- 
gestión durante el resto del tiempo aumenta, en particular después del 
período de ayuno. A medida que se prolonga la duración del ayuno, 
la rata llega a comer cada vez más continuamente durante el tiempo 
restante. El grado de hambre desarrollado durante el ayuno, por su- 
puesto, se ve aumentado, y asimismo, por tanto, aumenta la tasa con 
que la rata empieza a comer. Esta técnica de “compresión” es res- 
ponsable de la curva de ingestión típica, cuando el hambre de la rata 
pasa de un valor relativamente alto a un valor relativamente bajo. En 
el experimento presente la conducta de ingestión diaria se “compri- 
mió” hasta que toda ella ocurrió dentro de dos a dos horas y media. 

Las curvas particulares descritas antes dependen de muchas con- 
diciones experimentales; no sólo de la técnica de la compresión de la 
conducta, sino también de la forma y composición de la comida y de 
otros muchos factores que inciden sobre la situación. La cantidad 
de comida ingerida en dos horas y media en la figura 120 pudo haber 
sido ingerida en 15 o 20 minutos si se hubiera humedecido con agua. 
Por ello, probablemente sería ocioso buscar una “curva de ingestión” 
universal. El valor de la presente demostración radica, a mi juicio, en 
su relación con el sometimiento de la conducta a las leyes. Con un 
conjunto de condiciones bastante típico puede demostrarse un alto gra- 
do de regularidad, y podemos concluir que el tipo de variabilidad de 
la conducta que origina el problema del impulso es probablemente 
susceptible, en general, de un tratamiento similar. Bajo otras condicio- 
nes experimentales, debería ser posible dar un tratamiento cuantitativo 
semejante de las variaciones de la fuerza del reflejo recurriendo a las 
variables que son responsables del cambio. 


Bousfield ha confirmado mediante experimentos realizados con otros 
organismos, que el cambio de la fuerza de los reflejos de ingestión du- 
rante la misma constituye un proceso ordenado que se puede describir 
de una forma razonablemente precisa. En un estudio realizado con 
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gatos (29) se colocó una mezcla de leche y pescado u otro alimento en 
un plato situado en una balanza. A medida que el gato comía del pla- 
to, el movimiento hacia arriba de la balanza quedaba registrado en 
un quimógrafo. Se obtuvieron curvas de regularidad comparable a las 
que hemos reproducido anteriormente. Se descubrió que los estímulos 
extraños detenían la conducta de ingestión (como se había inferido en 
el caso de la rata) y, asimismo, se observó una tendencia similar a la 
compensación en virtud de un incremento de tasa posterior. 

Bousfield halló que sus curvas eran descritas de forma más precisa 
con la ecuación exponencial f = c (1 —e””*), Asimismo mostró que esta 
ecuación describía la tasa a la que las gallinas comían granos de trigo 
(31) y sostuvo que una ecuación exponencial es fundamentalmente razo- 
nable como descripción de una conducta con respecto a la comida. La 
constante c es la asíntote horizontal a la que se acerca la curva y puede 
identificarse con un límite fisiológico ideal de consumo de comida. 
Bousfield llama a 72 el “coeficiente de voracidad”. A partir de esta ecua- 
ción es capaz de mostrar que la tasa de ingestión varía directamente 
con la cantidad de comida que debe aún ingerirse antes de que se 
alcance el límite fisiológico. 


Cambios de fuerza durante la deprivación 


Los experimentos anteriores sobre el hambre se han referido casi 
exclusivamente a la disminución de la fuerza del reflejo que acompaña 
a la ingestión de la comida. Una cuestión adicional de igual importan- 
cia es hasta qué punto la fuerza cambia en sentido contrario durante 
la deprivación. Si examinamos una serie de curvas de ingestión diarias 
vemos que en efecto cambia, pero el curso del cambio aún no se ha de- 
terminado. En lo que concierne a las primeras veinticuatro horas no se 
presenta una gran dificultad al examinar la tasa a la que una rata em- 
pieza a comer después de diversos períodos de deprivación. Pero más allá 
de veinticuatro horas el problema se hace más complejo. Bousfield y 
Elliott (30) han descrito experimentos que sugieren que la tasa de in- 
gestión no puede considerarse proporcional al hambre durante ayunos 
prolongados. Estos autores han mostrado que cuando se permite a 
una rata que tome un alimento normal durante una hora diaria, un re- 
traso adicional en la alimentación produce una disminución del prome- 
dio de la cantidad ingerida. En un experimento realizado con 29 ratas 
descubrieron que si las ratas son alimentadas, no después de la depri- 
vación acostumbrada de veintitrés horas, sino tres horas y media des- 
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pués, la cantidad media ingerida disminuye en un 2%. Tras un retraso 
adicional de 12 horas, la disminución es del orden del 15%; tras 24 ho-- 
ras, del 14%. Las cantidades totales ingeridas reflejan una reducción 
uniforme de la curva de ingestión total. La figura 125, extraída de un 
artículo de Bousfield (82), muestra la curva normal obtenida durante 
un período de ingestión regular, y debajo de ella, la curva obtenida 
después de un ayuno relativamente largo de cuatro días de duración. 
A lo largo de la curva podemos observar claramente una reducción ge- 
neral de la tasa. Bousfield y Elliott han explicado las reducciones de 
tasa y de cantidad ingerida en un período limitado, en términos de los 


Ficura 125 


COMPARACIÓN ENTRE UNA CURVA DE CONTROL Y UNA CURVA DE INGESTIÓN 
RETARDADA 


Curvas reproducidas de Bousfield (32). La curva superior se obtuvo durante un 

periodo de alimentación diario regular y la curva inferior tras un ayuno de cuatro 

días. Cada peldaño representa la extracción de un gránulo de comida del aparato 

registrador (aproximadamente 1/4 de gramo). Las curvas duran aproximadamente 
unas 2 1/4 horas 


cambios de la capacidad del organismo para asimilar la comida como 
son, por ejemplo, los cambios de tamaño o tonicidad del estómago. 
De estos experimentos se desprende claramente que una rata no 
siempre come más rápidamente cuanto más hambrienta está. Pero tam- 
poco podemos afirmar lo contrario —que come más lentamente—, ya 
que si esta relación se mantuviera durante las primeras veinticuatro 
horas, una rata que no estuviera hambrienta en absoluto comería a una 
tasa máxima. La relación entre tasa y hambre es compleja y es inco- 
rrecto considerar que aquélla es proporcional a éste a lo largo de pe- 
ríodos de tiempo durante los cuales se permite que varíen importantes 
factores que afectan la relación. La tasa de ingestión es una medida 
imperfecta de la fuerza de los reflejos iniciales que entran en el acto de 
comer porque el acto completo de la ingestión implica otros factores. 
Aquí no nos interesa si Bousfield y Elliott han localizado correctamente 
esos factores. Seguramente no es responsable un solo factor de la in- 
trincada relación entre la tasa de ingestión y la deprivación durante 
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un largo período. En el registro de la figura 125 la simple debilidad de 
la rata al cabo de un ayuno de cuatro días puede explicar la reducción 
de la tasa de ingestión, especialmente si tenemos en cuenta que en 
este experimento se utilizó una substancia seca y dura. 

La utilidad de la tasa de ingestión como índice del hambre durante 
un solo período de alimentación no se pone en duda por los experi- 
mentos de Bousfield y Elliott, ya que los factores al parecer responsables 
del descenso de tasa observado por ellos son constantes durante un 
período tan corto. En el capítulo siguiente vamos a describir un método 
que evita los factores que estos autores notan y proporciona datos has- 
ta el punto de la debilitación completa de la rata. Demostramos un 
consistente aumento de la tasa de respuesta con el ayuno, porque la 
fuerza del miembro inicial de los reflejos de ingestión se ve sólo raras 
veces oscurecida por la terminación de la cadena. 


Los reflejos condicionados y su relación con el impulso 


La conducta de aproximarse a un pedazo de comida y de tomarlo 
es tan común en la conducta de una rata adulta y tan uniforme de una 
rata a otra, que es probable que se considere (erróneamente) como in- 
condicionada. En la rata adulta la conducta está tan bien establecida 
que su status condicionado queda prácticamente fuera de toda mani- 
pulación experimental. Para investigar el efecto de la ingestión sobre 
un reflejo condicionado controlado, reforzado con comida, es necesario 
unir un nuevo y arbitrario reflejo inicial a la cadena ingestiva para lo- 
grar ese fin. El reflejo de apretar una palanca es conveniente. Si refor- 
zamos todas las respuestas con comida y observamos la tasa, podemos 
seguir el curso del cambio de fuerza exactamente como en los experi- 
mentos precedentes. 

En la figura 126 (pág. 368) mostramos un registro típico de la misma 
rata de la figura 121. El registro abarca un período de una hora y me- 
dia, durante el cual la rata emitió 124 respuestas y comió un número 
igual de gránulos de comida, cuyo peso total fue de unos 8 gramos. 
La tasa empieza al máximo y declina gradualmente a lo largo del pe- 
ríodo. La curva sigue la curva teórica ya descrita en la figura 124. La 
curva suave de la figura tiene el mismo valor de n que en la figura 121. 

La semejanza de estas curvas sugiere que el cambio de fuerza 
después de la ingestión es independiente de la naturaleza del primer 
miembro de la cadena. Bajo otros aspectos, los dos tipos de curvas son, 
asimismo, similares. Ambas muestran retrasos y compensaciones subsi- 
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guientes, así como terminan bruscamente antes de que la tasa haya 
llegado a aproximarse a cero. Se producirá una excepción evidente si 
el miembro añadido consume tanto tiempo que el mantenimiento de la 
tasa inicial es imposible. Esto puede llegar a suceder cuando el miem- 
bro inicial debe repetirse, como bajo el reforzamiento, según una razón 
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CAMBIO DE TASA DURANTE LA INGESTIÓN CUANDO SE OBTIENEN LOS GRÁNULOS 
APRETANDO LA PALANCA 


La curva suave responde a la misma ecuación de la figura 121 


fija. Las razones del experimento descrito en el capítulo 7, eran de- 
masiado grandes para permitir un cambio de hambre durante la in- 
gestión, pero algunas de las ratas de ese experimento fueron sometidas 
más tarde a una razón de 16:1 para comprobar este punto, como ya 
hemos advertido. En la figura 99 ya dimos cuatro registros de una 
rata. El primero de ellos muestra la aceleración inicial positiva que se 
obtiene cuando se reduce de repente la razón a partir de un valor mu- 
cho más alto. Aunque los gránulos de este experimento pesaban apro- 
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ximadamente el doble de lo acostumbrado, se redujo la tasa de inges- 
tión real. Sin embargo, los cuatro registros muestran una aceleración 
positiva bastante regular a medida que aumenta el hambre. Las cur- 
vas no son tan regulares como cuando se refuerzan todas las respues- 
tas. Con la colaboración de Miss. M. F. Stevens hemos investigado otro 
caso de este tipo, en el que se hacía recorrer unos sesenta pies a una 
rata sobre una rueda giratoria para obtener cada gránulo de comida, 
administrado automáticamente al lado de la rueda. Naturalmente, la 
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Ficura 127 


REGISTRO DE LA INGESTIÓN DE COMIDA CUANDO UNA RATA DEBE RECORRER 
APROXIMADAMENTE MEDIA MILLA PARA OBTENER UN GRÁNULO DE COMIDA 


rata fue incapaz de alcanzar su tasa de ingestión inicial normal en este 
caso, aunque se observó un descenso más o menos regular. Este pro- 
cedimiento también introduce un elemento de fatiga que cabe esperar 
que afecte a la curva. 

En los experimentos en que las ratas tienen acceso continuo a la 
rueda giratoria y obtienen su ración diaria enteramente a base de re- 
correr una distancia determinada para cada gránulo, no he podido al- 
canzar resultados paralelos a los de Richter (67) relativos a un ciclo 
de ingestión relativamente constante. La diferencia tal vez puede de- 
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berse al hecho de que, en el presente caso, cada rata estaba aislada 
en una habitación insonorizada y sólo se la molestaba una vez al día 
para utilizar el aparato. En general las ratas comían periódicamente 
durante un período diario, pero permanecían inactivas durante el resto 
del día. En la figura 127 (pág. 369) damos registros típicos de la mis- 
ma rata correspondientes a dos días sucesivos, en que la rata tenía que 
recorrer la vigésima parte de una milla para obtener un décimo de un 
gramo de comida. El aparato se ponía en marcha diariamente hacia 
las 9 de la mañana, al principio de los registros de la figura 127, Como 
podemos ver, la rata comió durante el fin de la tarde y parte de la 
noche y mostró la periodicidad usual durante este período, pero pre- 
sentó un largo período diario de inactividad. 

Empleando ese programa la rata puede ganar peso, pero si aumen- 
tamos demasiado la distancia requerida, la rata gastará más energía 
en el recorrido que la que se verá reemplazada por la comida obtenida. 
Entonces la rata perderá peso gradualmente, aunque continuará co- 
rriendo. La distancia recorrida por día al final desciende, y el tiempo 
durante el que corre se extiende más uniformemente a lo largo de las 
veinticuatro horas. En la figura 128 reproducimos ocho registros con- 
secutivos para mostrar el cambio de conducta cuando la rata sigue ope- 
rando “sufriendo pérdidas” de esta forma. Al principio de cada registro 
damos el peso en gramos del final de cada día. La figura 127 muestra 
el período localizado de ingestión, evidente en los primeros registros de 
la serie, que desaparece gradualmente. Esto puede explicarse en tér- 
minos de una creciente necesidad de reposo y por la imposibilidad de 
sostener un solo período adecuado de carrera y de ingestión. Al final 
de la serie, la rata estaba agotada y no se pudo conseguir el experi- 
mento. Antes del agotamiento se puede observar una periodicidad bas- 
tante regular, pero aparentemente sólo porque hay energía disponible 
para una concentración de la actividad. 

La repercusión de estos experimentos sobre la conducta ingestiva 
típica puede formularse de la manera siguiente: Cuando los reflejos 
previos que conducen a la ingestión consumen tiempo y energía, ade- 
más de la simple ingestión de comida deben tenerse en cuenta otras 
variables, Dichas variables no invalidan la relación normal y son segu- 
ramente susceptibles de una descripción cuantitativa siempre que se 
considere necesario. 
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CAMBIO DEL TIEMPO DE CARRERA Y DE INGESTIÓN CUANDO LA ENERGÍA REQUERIDA 
PARA CORRER ES MAYOR QUE LA OBTENIDA MEDIANTE LA COMIDA 


La distancia recorrida por gránulo fue el doble que en la figura 127. La rata 
tiende a correr en períodos más cortos y a permanecer activa una mayor parte del 
día. El peso de la rata disminuye, tal como indicamos en gramos, después de ter- 


minar cada curva diaria 


3 
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La sed 


La formulación aplicada al hambre en la páginas precedentes puede 
extenderse a otros impulsos. Cada impulso tiene sus operaciones defini- 
torias, que plantean problemas técnicos especiales, pero podemos adop- 
tar, de hecho, el mismo enfoque. Debemos obtener cierta medida de 
la fuerza de la conducta y entonces puede determinarse la relación en- 
tre dicha fuerza y las diversas operaciones que la afectan. En el caso 
de la sed, por ejemplo, la conducta puede medirse de forma precisa 
como en el caso del hambre. En este caso, la operación que reviste 
especial importancia es la ingestión de agua o su privación y las 
técnicas de que disponemos son semejantes a las empleadas para el 
hambre, Hemos repetido algunos de los experimentos anteriores, aplica- 
dos ahora al caso de la sed, reemplazando el almacén de comida con 
un dispositivo que administra pequeñas cantidades medidas de agua. 

Los estados de sed esencialmente máximos se producen por medio 
de una privación prolongada de agua o mediante cualquier proceso 
que acelere la pérdida del agua por parte del cuerpo. Los grados de 
sed usados en los experimentos siguientes fueron, por lo general, consi- 
derablemente inferiores al máximo y, con muy pocas excepciones, se 
obtuvieron permitiendo a la rata que bebiera libremente durante una 
hora determinada y experimentando poco antes de dicha hora. Las 
ratas siempre tenían acceso a la comida excepto durante los experi- 
mentos. 

Se puede mostrar un cambio considerable de la fuerza del reflejo 
debido a la bebida simplemente dando a la rata libre acceso a la pa- 
lanca y reforzando cada respuesta. Las curvas resultantes son continuas 
O muestran una sola discontinuidad. En la figura 129 presentamos re- 
gistros que muestran casos extremos y diversos casos intermedios. La 
curva continua es semejante, aunque no idéntica, a la curva típica ob- 
tenida cuando el reflejo se refuerza con comida (ver figura 120). No 
se ha observado con el hambre ningún efecto comparable a la curva 
discontinua, aunque la curva de ingestión típica termina, en general, 
de una manera brusca. En la sed, el cambio brusco puede ocurrir an- 
tes de que haya tenido lugar un cambio de tasa significativo. 

Se obtienen curvas similares cuando se refuerza la respuesta a la 
palanca según una razón fija. En la figura 180 (pág. 374) mostramos 
cuatro curvas de una misma rata. La razón era de 12:1. Las curvas 
pueden compararse bien con las de la figura 129, ya que tanto unas 
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como otras muestran una gama que va desde una aceleración negativa 
Suave a una ruptura brusca. 

Como en el caso del hambre, existe más de una operación que 
afecta a los reflejos que conducen a la ingestión del agua. La simple 
bebida es sólo una de ellas y por tanto la descripción anterior es in- 
completa. Mi presente propósito es demostrar la regularidad de un caso 
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Ficura 129 2 
CAMBIO EN LA TASA DE BEBIDA DURANTE UN PERÍODO DE BEBIDA DIARIO 


Se reforzó cada respuesta con una pequeña cantidad de agua. Las curvas pueden 
presentar discontinuidad o no. La curva continua se puede comparar bien con 
la curva de ingestión (figura 120) 
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típico, con la implicación de que otras operaciones pueden tratarse 
con éxito comparable. 


La sed como impulso arbitrario 


Además de los diferentes cambios de fuerza que caracterizan a los 
diversos impulsos, es preciso comparar los efectos reforzantes de los es- 
tímulos que caen dentro de las diferentes clases de impulsos. 
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Ficura 130 


CURVAS OBTENIDAS CUANDO SE REFUERZAN LAS RESPUESTAS CON AGUA 
A UNA RAZÓN FIJA DE 12:1 


Repitiendo unos cuantos experimentos representativos utilizando la 
sed en lugar del hambre se ha tratado de comprobar si los resultados 
citados en los capítulos anteriores pueden generalizarse a la conducta 
basada en otro impulso. En el condicionamiento original, un reforza- 
miento seguido de extinción mostró un efecto comparable al del caso 
del hambre. En un experimento realizado con cuatro ratas, una de las 
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curvas mostró un efecto de un solo reforzamiento, aún mayor que el 
obtenido con la comida. Esta curva viene reproducida en la figu- 
ra 131 A. Durante los primeros 38 minutos se hicieron tres respuestas 
que no fueron reforzadas. 


RESPUESTAS 


TIEMPO EN MINUTOS 


Ficura 131 2 
La SED COMO UN IMPULSO ARBITRARIO 


A: efecto de un solo reforzamiento con una pequeña cantidad de agua (cf. figu- 

ra 15). B: extinción después del reforzamiento con agua. C: en (a) se producen 

algunas respuestas en virtud de la transferencia del condicionamiento previo a la 

palanca por medio de comida; en (b) se reforzó una respuesta con agua; a partir 
del punto (c) se reforzaron todas las respuestas con agua 


La cuarta, indicada por la flecha, fue la única respuesta en la his- 
toria del animal que fue reforzada. La curva de extinción que siguió 
puede compararse con la de la figura 15. También se registraron siete 
curvas de extinción tras considerables cantidades de condicionamiento. 
En la figura 181 B damos un ejemplo típico de ellas. 

En varios casos las ratas utilizadas habían sido sometidas a expe- 
rimentos con comida. En la figura 131 C mostramos un registro típico 
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en el que puede observarse la transferencia. Las ratas de este grupo 
habían sido condicionadas con comida tres meses antes y habían desa- 
rrollado varias discriminaciones basadas en el hambre. Se sometieron 
a un régimen de sed y se entrenaron al sonido del almacén mediante 
reforzamiento con agua en ausencia de la palanca. En la figura 181 C 
la rata fue soltada en a. Antes de este período experimental la rata 
no había recibido agua en presencia de la palanca. Tenía acceso cons- 
tante a la comida y en este experimento estaba presente en la caja 
de modo que la rata no podía estar hambrienta. Las respuestas de la 
rata durante los primeros 38 minutos no fueron reforzadas. Como no 
había tenido lugar ningún condicionamiento con agua hasta entonces, 
esta respuesta inicial puede considerarse como una transferencia de 
fuerza de un impulso a otro a través del factor común del sonido del 
almacén. La tasa mostrada en esta figura (34 respuestas por hora) re- 
presenta casi exactamente el promedio de las ratas sometidas al expe- 
rimento. El primer retraso es característico en cinco registros. La ligera 
aceleración negativa durante este período de transferencia es también 
característica y seguramente indica la extinción de la fuerza adquirida 
del otro impulso. En b se reforzó una sola respuesta con agua y se 
obtuvo una curva de extinción subsiguiente. En los siete registros apa- 
reció un efecto claramente observable del reforzamiento de esta sola 
respuesta. Esta parte de la curva puede compararse con la figura 131 A. 
En c se inició el reforzamiento de todas las respuestas. Se desarrolló 
una tasa máxima, seguida de un descenso a medida que se debilitaba 
el impulso con la ingestión de bebida. En c podemos advertir una acu- 
Sada aceleración positiva a medida que aumenta la fuerza del reflejo 
nuevamente condicionado. Esto es característico de los siete registros 
y, como hemos notado, generalmente se observa siempre que se pro- 
duce un recondicionamiento después de la extinción. 


La actividad espontánea 


Otro impulso que puede someterse al mismo tratamiento es la “ac- 
tividad”. El dato fundamental es del mismo tipo: un organismo, unas 
veces está activo y otras veces no. ¿Puede describirse esta variabilidad 
mediante una operación? 

En el uso tradicional del término “actividad espontánea” no se ha 
realizado ningún intento para distinguir entre las diversas formas que 
la actividad puede revestir. Como cada forma debe tener sus propias 
unidades, es prácticamente imposible una medida cuantitativa de la 
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totalidad de la actividad. Una medida indirecta, como la producción 
de calor o el consumo de oxígeno, no resuelve este problema. Aun 
cuando se pudiera idear una medida separada de cada forma de con- 
ducta, todavía tendríamos que reducir los datos resultantes a una uni- 
dad común de actividad. El uso de una rueda giratoria brinda una 
solución práctica al elegir una forma de actividad que puede medirse 
cuantitativamente y suprimir, en la medida de lo posible, todas las 
demás formas. Si se confina una rata en una pequeña caja con acceso 
a una rueda giratoria, su actividad puede registrarse en el contador 
de la rueda simplemente en términos de la distancia recorrida. La va- 
lidez de esta medida depende del grado de eliminación de las otras 
formas de conducta y los resultados son significativos sólo cuando se 
especifican una serie de factores de la situación, como por ejemplo los 
sonidos, la temperatura, la iluminación, etc. 

Otro importante factor, si queremos intentar un análisis preciso de 
la conducta, es la misma rueda. Teóricamente, podría usarse un deter- 
minado conjunto de especificaciones para definir una rueda normal. 
Sin embargo, tenemos buenas razones para preferir aquel conjunto que 
duplique en la medida de lo posible las condiciones de la carrera sobre 
una suferficie llana. Esta no es sólo la forma más natural de conducta, 
y por consiguiente la menos perturbadora, sino también, mecánicamen- 
te, la más simple. La rueda giratoria, en resumidas cuentas, puede con- 
siderarse como un substituto de un suelo al mismo nivel, que sería el 
instrumento ideal si no fuera impracticable. Por tanto, la rueda debe 
construirse de acuerdo con estas premisas. Las características de un 
suelo al mismo nivel, por supuesto, no pueden reproducirse fielmente 
con una rueda. Para duplicar el trabajo consumido en cualquier acele- 
ración, la rueda debe tener un momento de inercia igual al peso de 
la rata. Pero ello introduce efectos de rotación y de traslación, que se 
hallan ausentes en la carrera a ras del suelo. Además de esta dificultad 
inherente, se presentan asimismo limitaciones técnicas que debemos 
considerar en la construcción de la rueda, limitaciones derivadas prin- 
cipalmente de su curvatura. La mayor sección del perímetro de la 
rueda tocada en cualquier instante por la rata debe ser sensiblemente 
llana. Pero el momento de inercia de la rueda aumenta rápidamente 
con su radio, y el problema radica en determinar la curvatura máxima 
(el radio mínimo) que carezca de importancia al comparar la mecá- 
nica de la carrera en una rueda con la de la carrera sobre una super- 
ficie llana. Un compromiso simple al que podemos llegar es fijar un 
radio que sea al menos el doble de la longitud máxima de superficie 
tocada por la rata en movimiento, en cualquier momento. Puede de- 
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terminarse como un valor razonable, un momento de inercia igual al 
doble del peso de la rata. 

Dicha rueda puede mejorarse considerablemente con la adición de 
una pequeña fricción adicional, que amortigije la oscilación y así co- 
rrija hasta cierto punto el efecto indeseable del peso necesario de la 
rueda. Suponiendo que el peso de la rata sea de 175 gramos y que el 
momento de inercia sea de 350 gramos, una fricción de deslizamiento 
de 10 gramos (expresada como el peso que actúa verticalmente en la 
periferia que mantendrá la rueda en movimiento) amortiguará con éxi- 
to toda oscilación ordinaria dentro de uno o dos ciclos. Para vencer 
esta fricción la rata corre a una pendiente de un poco más de 3%, lo 
cual no supone una desviación muy considerable de una superficie 
llana. Ya hemos descrito en otra publicación una rueda con estas pro- 
piedades (8) dotada de un dispositivo para registrar la distancia reco- 
rrida en función del tiempo. 

A partir de este punto el problema es paralelo al del hambre. Se 
da una periodicidad similar de la actividad, así como una posibilidad 
semejante de compresión. Los registros de períodos sucesivos de vein- 
ticuatro horas cada uno se componen de fases de actividad y de inac- 
tividad, con cierta relación entre la distribución de la actividad y el 
tiempo que se dedica diariamente al aparato y a la rata. Si introdu- 
cimos ahora un intervalo en el período de veinticuatro horas durante 
el cual se interrumpe el acceso a la rueda, la parte restante del período 
muestra una mayor actividad por unidad de tiempo y la distribución 
está claramente relacionada con el intervalo de confinamiento, en cuan- 
to que éste se ve seguido por un arranque de actividad relativamente 
intenso. Si se prolonga gradualmente el confinamiento, la densidad de 
la actividad durante el resto de período aumenta, hasta que se alcanza 
una duración del intervalo en que el período activo restante no mues- 
tra ninguna fase de inactividad. La duración de este período varía en 
función de varios factores, pero puede ser del orden de cuatro a seis 
horas. 

Si no hay un cambio diurno significativo en el ambiente, una rata 
se adapta rápidamente a realizar su recorrido a cualquier hora deter- 
minada. Por consiguiente, puede llevarse a cabo un experimento siem- 
pre que las condiciones del laboratorio sean más convenientes, especial- 
mente en lo que respecta al ruido. Para soltar a la rata nos hemos 
valido de un despertador ordinario. En los experimentos que ahora 
pasaremos a describir se adoptó el procedimiento siguiente: El período 
experimental finalizaba a las 8.30 de la mañana. En este momento se 
quitaba el registro del tambor y se daban a la rata los cuidados apro- 
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piados. Entonces se cerraba la caja, se colocaba un nuevo tambor en 
el quimógrafo y se preparaba el despertador para el próximo experi- 
mento. La duración del período activo se determinaba por la hora del 
despertador. Por ejemplo, el despertador se graduaba a las 3.80 de la 
madrugada si se deseaba un período de cinco horas. Durante las vein- 
ticuatro horas no se requería ningún otro cuidado. 

Reproducimos las figuras 182 y 133, a partir de una serie de regis- 
tros obtenidos con una sola rata hembra de unos 125 a 175 días de 
edad. Se ven confirmados, en lo que se refiere al comentario general 
sobre ellos, por varios centenares de registros de muchas otras ratas que 
representan en total varios millares de horas experimentales. Muchos 
de estos registros se obtuvieron mientras que estábamos procediendo al 
diseño de la rueda empleando una serie de modelos de prueba, y difie- 
ren en diversos puntos que son irrelevantes para nuestro presente 
propósito. Las figuras que incluimos tienen por misión mostrar el tipo 
de resultado que cabe esperar y la aplicabilidad de este método a va- 
rios problemas concernientes a la actividad. 

Se soltó la rata a las 3 de la madrugada y los experimentos finali- 
zaron entre las 8 y las 9 de la mañana. Se observaron las precauciones 
usuales. La temperatura de la habitación varió en menos de 2 C du- 
rante la serie entera de experimentos y probablemente en menos de 
0.5” C durante un solo período experimental. La temperatura media fue 
de unos 21” C. La habitación estaba oscura durante la actividad de la 
rata y durante la mayor parte del período de confinamiento, y estaba 
completamente insonorizada. No se hallaban presentes otros animales. 
La rata siempre tuvo acceso a un recipiente de agua potable. 

La figura 132 constituye un registro típico diario obtenido con una 
fricción de unos 15 gramos. La tasa de carrera empieza al máximo y 
durante las tres horas siguientes muestra un suave descenso gradual 
pero notable, que se puede observar mucho mejor si escorzamos el re- 
gistro. La variabilidad de esta parte de la curva, al proceder a su exa- 
men, resulta estar, hasta cierto punto, en función de la pendiente, incre- 
mentándose aquélla a medida que ésta desciende. Después de tres 
horas, el registro muestra repentinamente una mayor variabilidad, pero 
la extrapolación de la primera parte de la curva se llega a alcanzar, 
más tarde, casi por completo. 

Para obtener un registro de esta duración es necesario eliminar la 
conducta de alimentación que ordinariamente aparecería durante el pe- 
ríodo. Esto puede lograrse mediante la adición de una tapadera al co- 
medero, que queda cerrado al principio del período cuando se dispara 
el despertador. Si no se toma esta precaución, la curva se ve interrum- 
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pida por retrasos que no son compensados adecuadamente y la forma 
de la curva revelada en la figura 132 se ve deformada. Durante un 
período de seis horas no se desarrolla un hambre considerable, a pesar 
de que se ha eliminado la conducta de alimentación. 

Si repetimos varios días este procedimiento, se desarrolla un ciclo 
de hambre condicionado, cuyo punto culminante se sitúa al final del 
experimento cuando la rata recibe el alimento. Cuando se ha condicio- 
nado plenamente a la rata para comer, por ejemplo, a seis horas después 
del inicio del experimento, el registro adopta la forma que muestran las 
figuras 138 A y 1833 B. Durante la última parte del período se desarrolla 
una condición de hambre muy acusada, que se refleja en un aumento 


MILLAS 


HORAS 


Ficura 1328 


CAMBIO EN LA TASA DE CARRERA EN UNA RUEDA DURANTE UN PERÍODO 
DE CARRERA DIARIO 


Compárense las figuras 120 y 129 


de la actividad. La curva resultante es, esencialmente, una línea recta, 
si la supresión de la comida coincide con el inicio del período de acti- 
vidad. La diferencia entre los dos tipos de curva constituye una indica- 
ción de la manera en que se forma el ciclo condicionado de hambre 
durante el período y, dando por supuesta la posibilidad de una descrip- 
ción cuantitativa, constituye una valiosa medida de dicho proceso. No 
todas las ratas dan líneas rectas, pero en general cada rata tiene una 
curva característica que puede predecirse adecuadamente. 

La rata corre sobre la rueda en una posición tal que el componente 
gravitacional que actúa tangencialmente es igual a la fricción. El apa- 
rato, tal como lo hemos descrito, incluye una fricción variable que va 
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desde prácticamente cero hasta unos 50 gramos, A partir de los 50 gra- 
mos es probable que surjan dificultades técnicas en mantener un coefi- 
ciente de fricción constante y en evitar el chirrido y el rechinamiento 
del freno. La gama disponible de pendientes a las que se puede hacer 
correr una rata de 175 gramos con esta rueda, por lo tanto, va desde 
prácticamente cero hasta unos 16”. La figura 133 demuestra el efecto 
de la fricción sobre la conducta de la rata. El registro A se obtuvo cuan- 


MILLAS 


MILLAS 


HORAS 


Ficura 133 8 


TASA DE CARRERA CUANDO LA RATA ES ALIMENTADA REGULARMENTE AL FINAL 
DEL PERÍODO DE CARRERA 


Los registros A y B se tomaron con diferentes fricciones de la rueda y tienen 
pendientes distintas 


do la fricción de la rueda era aproximadamente de 14.3 gramos. En el 
registro B, tomado al día siguiente, la fricción fue de 19.5 gramos. Las 
líneas rectas trazadas a lo largo de los registros tienen las pendientes 
de 52” y 48”, respectivamente. El registro total se ve modificado por 
el cambio de pendiente y de manera uniforme. 
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La naturaleza del impulso 


La formulación anterior sobre el impulso puede resumirse de la 
manera siguiente: Al medir la fuerza de un impulso, en realidad no 
estamos midiendo más que la fuerza de la conducta. Para obtener una 
explicación de esta última no tenemos más que examinar las operacio- 
nes que pueden afectarla. El “impulso” es un estado hipotético inter- 
polado entre operación y conducta y no es absolutamente necesario en 
un sistema descriptivo. Sin embargo, el concepto es útil como instru- 
mento para expresar la compleja relación que se obtiene entre las di- 
versas operaciones similarmente efectivas y un grupo de formas cova- 
riantes de conducta. Las propiedades asignadas al estado se derivan de 
las observaciones de esas relaciones. 

Cuando las operaciones que afectan al impulso pueden reducirse a 
una forma única (como por ejemplo, cuando se dice que la sed depende 
de la condición del cuerpo con respecto a su suministro de agua, aun 
cuando las operaciones que afectan a esta condición sean múltiples), 
y cuando todas las formas de conducta afectadas por el impulso varían 
conjuntamente (como sucede aparentemente con la sed), el estado del 
impulso en sí puede considerarse simple y unitario. Pero esto no siem- 
pre es cierto, como podemos ver al considerar el complejo caso del ham- 
bre. El primer hecho que sugiere la complejidad del impulso del hambre 
es que en cualquier momento de la vida del organismo éste ingerirá 
diferentes tipos de alimento a tasas distintas. Los reflejos condiciona- 
dos reforzados por diferentes comidas también diferirán en fuerza. 
Young (80) ha estudiado la “preferencia” de la rata blanca por los di- 
versos tipos de alimento. No sólo la rata tiene preferencia por diferen- 
tes tipos de comida, sino que dos alimentos se ingieren a tasas asimismo 
diversas. Cuando dos tipos de alimento se hallan presentes como estímu- 
los al mismo tiempo, el reflejo más fuerte se convierte en predominan- 
te al “elegir la rata la comida preferida”. Pfaffmann (66) ha demostrado 
una relación entre velocidad de ingestión y propiedades gustativas de 
la comida, en el gato recién nacido. 

Tradicionalmente, se ha propuesto la noción de “apetito” para ex- 
plicar las diferencias en la conducta de ingestión con respecto a los 
distintos alimentos, especialmente por aquellos que están interesados 
en identificar un solo mecanismo del hambre (36). Se dice que comemos 
el plato fuerte de una comida porque estamos hambrientos, pero que 
comemos el postre porque nos “apetecen” los dulces. Los hechos obser- 
vados son que unas veces comemos un plato fuerte (o un postre si no 
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hay plato fuerte) y otras veces sólo el postre. Decir que comemos un 
dulce cuando no estamos hambrientos es dar un significado restringido 
al término hambre. Ciertamente, en algunas ocasiones estamos ham- 
brientos de postre hasta cierto punto. Sería difícil especificar un grupo 
de alimentos cuya ingestión indicara hambre y otro cuya ingestión de- 
notara apetito. 

La concepción dual del hambre y apetito constituye un paso en 
la dirección correcta, pero es insuficiente. El hambre no es dual sino múl- 
tiple. Debemos especificar el tipo de alimento antes de que podamos 
predecir la fuerza de la conducta de ingerirlo, y, por consiguiente, an- 
tes de que podamos asignar un grado de hambre al organismo. En 
cualquier momento dado, cada forma de comida rige una cierta fuerza 
de conducta, y se pueden clasificar todos los tipos de alimento en una 
escala de acuerdo con sus fuerzas correspondientes. En los casos ex- 
tremos de hambre, el organismo comerá prácticamente todo lo que se 
le presente, aunque de todas formas comerá las diferentes substancias 
a distintas tasas. En los estados completos de saciedad puede que no 
coma nada. En cualquier estado intermedio puede comer todos los tipos 
de alimento hasta un punto determinado según el orden de preferen- 
cia. Esta clasificación de las comidas podría basarse únicamente en la 
estimulación gustativa. Es cierto que el estado físico de la comida a 
menudo desempeña un papel importante, pero podemos limitarnos a una 
forma o textura básicas que varía sólo con el sabor. 

Hasta ahora hemos hablado de las propiedades estimulantes de la 
comida. Antes de que finalicemos con el tema de la compleja estruc- 
tura del hambre, debemos también tener en cuenta posibles diferencias 
en las formas de afectar la fuerza de los reflejos de ingestión. Para con- 
vertir un organismo en hambriento o para saciarlo, podemos deprivarlo 
o alimentarlo con diferentes clases de comida. El resultado es el des- 
plazamiento de ciertos tipos de alimento en el rango previamente de- 
terminado a partir de las relativas fuerzas de ingestión. Para poner un 
ejemplo corriente, si damos a la rata grandes cantidades de sal despla- 
zamos en sentido negativo la fuerza de ingestión de todas aquellas co- 
midas que presentan un acusado sabor a sal. Inversamente, si suspende- 
mos la dieta a base de sal, aumentamos la fuerza de las mencionadas 
comidas, creando así un hambre de sal. 

Definimos una subhambre de este tipo en términos de la covaria- 
ción de las fuerzas relativas. Decimos que un organismo está hambriento 
de sal si la fuerza de la conducta de comer todas las comidas saladas 
es relativamente alta. Es difícil determinar si una substancia de un 
sabor determinado puede siempre aislarse tomando como la base la 
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covariación. Debemos, pues, proceder a identificar la substancia o subs- 
tancias que deben darse como alimento o ser excluidas para modificar 
las fuerzas de estos reflejos como grupo. Cuántas subhambres hay, qué 
estimulación sensorial es la apropiada para cada una, y cuáles son las 
Operaciones que afectan a cada una, son problemas que no podemos 
tratar aquí. Sin embargo, la técnica del aislamiento queda indicada de 
forma suficientemente clara en esta aproximación al problema. 

W. A. Bousfield ha realizado algunos experimentos sobre las sub- 
hambres y amablemente me ha permitido reproducir aquí un breve re- 
sumen de los mismos. Ya hemos mencionado los trabajos de Bousfield 
en lo que se refiere a la confirmación de un cambio ordenado de la 
tasa de ingestión. En sus experimentos realizados con gatos utilizó cua- 
tro mezclas de comida diferentes: A) leche, B) leche, avena cocida y 
ternera picada cruda, C) pescado picado y leche, y D) riñón de ternera 
picado y leche. Logró ir más allá de la preferencia relativa de sus gatos 
por estas comidas para pasar a la cuestión de las subhambres mostran- 
do que cuando se había obtenido una curva de saciedad con un tipo 
de comida, el cambio a otro tipo de alimento podía hacer volver comer 
al gato, lo cual producía así una segunda curva. De esta forma, fue 
capaz a veces de obtener tres curvas sucesivas. Midiendo las cantida- 
des de comida ingerida, logró descubrir la medida en que la ingestión 
de un tipo de alimento reducía la fuerza de la conducta con respecto a 


TABLA 9 
Segunda comida en gramos 
A B o D 

=] 

E ej A (140) — (166) 52 (128) 12 (114) 130 
8 S B (176) — (128) — (172) 80 (136) — 
S “Cl (180)86 (114) 40 (168) — (192) 42 
E Bl E o (214) — (184) — (280) — (200) — 


otro, Uno de los gatos de Bousfield dio los resultados que mostramos 
en la tabla 9. Las cifras entre paréntesis representan el número de gra- 
mos de la comida indicada a la izquierda ingeridos en la primera curva 
de saciedad. Las otras cifras representan el número de gramos de la 
comida indicada en la parte superior de la tabla, ingeridos en la se- 
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gunda curva de saciedad que sigue inmediatamente. Así, si se dio pri- 
mero al gato la comida A o C hasta la saciedad, el gato reanudó su 
conducta ingestiva cuando se le presentaron cualesquiera de las otras 
comidas. Si se le hubiera dado primero la comida D, el gato no hubiese 
comido más. Por otra parte, la comida B redujo todas las hambres ex- 
cepto la de la comida C. 

El método de Bousfield es evidentemente de gran valor para el es- 
tudio de las subhambres. El caso de la deprivación prolongada de una 
sola comida y los relativos cambios de fuerza que ocurren podría tra- 
tarse de la misma forma. Se podrían sugerir refinamientos como la 
reducción de las comidas a una textura única y el uso de propiedades 
gustativas y metabólicas más elementales. 


La clasificación de los impulsos 


El carácter múltiple del hambre inmediatamente sugiere el proble- 
ma más amplio de la identificación y de la clasificación de los impulsos 
en general. Existe la tendencia natural de tratar de reducir los impul- 
sos de un organismo al número menor posible debido a la relativa simpli- 
cidad que así se logra, pero nos vamos a adentrar en la materia sólo 
en la medida en que la conducta nos lo permita. Sin tratar de hacer 
aquí una clasificación (caería fuera del ámbito de este libro intentar 
introducir una cuestión puramente topográfica) puede valer la pena 
considerar las formas en que se observan los fenómenos del impulso y 
hasta qué punto podemos averiguar el número de impulsos de un or- 
ganismo. 

Es importante dejar bien sentado que aquí no nos interesa la clasi- 
ficación de una serie de tipos de conducta, sino sólo la conducta que 
sufre cambios de fuerza como resultado del tipo de Operación que de- 
fine el campo. No enumeramos el impulso de contraer la pupila del 
ojo porque este aspecto de la conducta es relativamente invariable. Si 
los reflejos sexuales fueran igualmente invariables, no tendríamos un 
impulso sexual, sino sólo conducta sexual. En este momento nos intere- 
sa el número de operaciones que modifican la fuerza del reflejo o, para 
expresarlo en un orden más lógico, los cambios de la fuerza del reflejo 
cuyas variables tratamos de averiguar. 

Al observar las cosas por primera vez, cada variación de la fuerza 
de un reflejo controlado por una operación determinada parece ser un 
caso aparte y podemos suponer la existencia de un impulso separado. 
Sin embargo, si observamos que las fuerzas de dos o más reflejos están 
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igualmente en función de la misma operación, resulta posible una re- 
ducción del número de impulsos. De esta forma consideramos el ham- 
bre, el sexo, etc., como impulsos relativamente inclusivos pertinentes 
a una gran variedad de formas de conducta. La unidad del impulso 
depende de la covariación de los reflejos a los que se refiere. Para sa- 
ber si un reflejo determinado pertenece o no a un impulso dado de- 
bemos considerar más la covariación que una propiedad esencial de 
la conducta en sí. Así, la vieja cuestión de si la mayor parte de la con- 
ducta es sexual no debe formularse tanto en el sentido de si es de na- 
turaleza sexual como en cuanto a si varía en función de las operaciones 
que definen dicho impulso. ¿Afecta una operación que reduce el im- 
pulso sexual a la conducta en cuestión de la misma forma? 


Impulsos múltiples 


En una operante condicionada el impulso que rige la fuerza viene 
determinado por el reforzamiento. Si el acto de apretar la palanca ha 
sido reforzado con comida, la fuerza varía con el hambre; si ha sido re- 
forzado con agua, varía con la sed, etc. Una operante puede reforzarse 
con estímulos de más de una clase de impulsos, y su fuerza entonces 
viene determinada por dos o más impulsos. En un experimento sobre 
la sed se intentó emplear algunas ratas de un experimento anterior 
realizado sobre el hambre. A diferencia del experimento antes descri- 
to, en las cajas no había comida. Como una gran sed impide la inges- 
tión de comida (seca), antes del experimento se obtuvieron curvas com- 
puestas que representaban las respuestas controladas por ambos impulsos 
tan pronto como la recepción de una pequeña cantidad de agua hubo 
incrementado el hambre. 

La posibilidad de impulsos múltiples constituye la respuesta a la 
objeción que se hace con frecuencia al uso de la tasa de ingestión como 
medida del hambre, a saber, que la ingestión frecuentemente ocurre 
sin hambre y que, por tanto, no puede ser una medida fiable. Pero esto 
sólo es así cuando el reforzamiento ha sido múltiple. El hecho de re- 
coger un pedazo de comida y de ponérselo en la boca, generalmente, 
se ve reforzado por la misma comida, pero puede reforzarse “artificial- 
mente” a base de presentar agua, y un animal sediento, pero no ham- 
briento, entonces introducirá comida en su boca. Estos reforzamientos 
adicionales son numerosos en la vida cotidiana. El niño que debe co- 
mer la sopa antes de obtener el postre no come porque su hambre de 
sopa sea necesariamente grande, sino porque su hambre de postre es 
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grande. El hecho de comerse la sopa en tal caso es comparable con 
cualquier otra operante como el decir “Por favor” o tocar el piano. La 
observación momentánea de la conducta sería inútil en cualquier ex- 
ploración del impulso a menos que se conozca el hecho del reforzamien- 
to a base del postre. 

Todos los casos de este tipo pueden identificarse por la presencia 
de reforzamientos en más de una clase de impulsos, y no invalidan la 
presente formulación, así como tampoco indican que no pueda lograrse 
la predicción de la conducta cuando se conocen los factores relevantes. 


Deseo y aversión 


A un tratamiento del impulso simplemente en términos de la fuerza 
del reflejo puede objetarse que no reconoce el carácter del estado de 
la conducta, a todas luces intencional. Puede decirse que un organismo 
hambriento come, no porque esté hambriento, sino con objeto de redu- 
cir su hambre. La relación expresada por la locución “con objeto de”, 
a mi juicio, es irrelevante; pero una descripción del impulso sería ina- 
decuada si dejara de advertir el importante hecho de que la conducta 
que se ve fortalecida durante el estado intensificado de un impulso, 
generalmente, conduce a una operación que afecta a dicho impulso. No 
veo por qué ello tenga que implicar ningún principio teleológico no apli- 
cable igualmente a la digestión, pongamos por caso. Así, pues, no 
hacemos más uso de esta relación en la descripción del impulso, ya que 
el dato importante es la fuerza de la conducta en un momento dado. 
Por consiguiente, el impulso no puede expresarse como un “deseo” o 
“ansia” o como cualquier otro estado dirigido hacia el futuro. 

En la relación entre “deseo”. y “aversión” se plantea un problema 
de clasificación que, a primera vista, puede requerir el concurso del 
efecto de la conducta modificando su propio estado. Cuando la fuerza 
de una operante se aproxima a cero con el descenso de su impulso, se 
alcanza un punto en que puede decirse que el organismo es “indife- 
rente” a los estímulos en presencia de los cuales ha respondido hasta 
ahora. Con un ulterior descenso del impulso, que puede obtenerse en 
un animal no hambriento mediante el uso de impulsos múltiples, la 
“indiferencia” puede dar lugar a la “aversión”, en la que se emite una 
forma opuesta de respuesta. En lugar de comer, por ejemplo, el orga- 
nismo sobrealimentado puede rechazar la comida o apartarse de ella 
rápidamente. Si agrupamos en la misma categoría tanto el acto de co- 
mer como el rechazo de la comida, consideréndolos como “conducta 
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con respecto a la comida” podemos establecer una serie continua de 
estados que van de un “deseo” extremo positivo hasta una “aversión” 
extrema negativa pasando por un punto medio neutro. Y esto es lo 
que ocurre normalmente. Esta ambivalente unidad de conducta sólo 
puede justificarse recurriendo a su efecto, puesto que el acto de co- 
mer y el rechazo de la comida son completamente diferentes desde el 
punto de vista topográfico. ¿Debe introducirse algún tipo de relación 
intencional en este punto? 

La respuesta dictada por la presente formulación es que en ningún 
caso podemos considerar formas de conducta topográficamente dife- 
rentes, como aspectos de la misma respuesta, aun cuando una Sea apro- 
ximadamente el reverso de la otra. De la misma forma, tampoco pode- 
mos asignar valores negativos de fuerza tal como requeriría dicho 
sistema. Los actos de coger la comida y de rechazarla son respuestas di- 
námicamente separadas y sus fuerzas pueden expresarse separadamente. 
Como ha señalado Sherrington, generalmente, puede decirse que una 
respuesta prolonga un estímulo o que lo interrumpe. Los organismos 
frecuentemente poseen respuestas de ambos tipos con respecto al mis- 
mo estímulo. Por razones de economía no es probable que estén rela- 
cionados con el estado del organismo de tal forma que ambos sean 
fuertes al mismo tiempo (aunque este caso se puede crear mediante 
condicionamiento). También cabe esperar, por razones de economía, 
que la misma operación afecte a sus dos fuerzas aunque en direcciones 
diferentes. Así, pues, podemos formular el problema “del deseo y la 
aversión” con respecto a la comida de la forma siguiente: Un organismo 
posee las dos operantes de: a) coger e ingerir la comida, y b) recha- 
zarla. Las operaciones que debilitan a a) fortalecen a b) y viceversa. Si 
se alimenta a un organismo hambriento, la fuerza de a) desciende y 
la de b) aumenta hasta que, si se lleva la alimentación más allá de 
cierto punto, el organismo llega a rechazar la comida. Las relaciones 
entre esas respuestas son las siguientes: 1) los estímulos discriminativos 
o provocadores (es decir, la comida) son los mismos para ambas; 2) la 
operación que modifica la fuerza es la misma para ambas, pero actúa 
en sentidos diferentes. El hecho de que un organismo posea dos res- 
puestas tan íntimamente relacionadas se puede explicar, como se ex- 
plican todas las funciones del organismo, recurriendo a cierta forma 
de desarrollo evolutivo. Si el efecto del impulso es importante en algún 
aspecto, lo es en ese desarrollo y no en la descripción de la conducta 
corriente. 
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El impulso en cuanto no es estímulo 


El intento de describir la conducta como el efecto forzoso de la 
“situación estimulante total” es quizás responsable de la concepción 
en boga del impulso como estímulo. En el tratamiento del hambre, por 
ejemplo, se dice corrientemente que una batería de impulsos proceden- 
tes del estómago vacío impele al organismo a buscar comida. Partiendo 
del mismo modelo, un gran número de estímulos supuestos o conocidos 
se han hecho encajar dentro de las fórmulas del estímulo-respuesta 
con objeto de explicar la variabilidad de la conducta que origina el 
problema del impulso. El hambre se presta más fácilmente a esta in- 
terpretación a causa de la estimulación interoceptiva responsable de 
las “punzadas” del estómago. La analogía con el acicate externo es 
fuerte, El estómago vacío, como cuando nos aprieta un zapato, propor- 
ciona el tipo de estimulación que al desaparecer actúa como un refor- 
zamiento positivo. A la corta o a la larga, llegamos a ingerir comida 
o a quitarnos el zapato, de acuerdo con el caso. Pero la estimulación 
que se origina en el estómago no tiene un paralelismo exacto con los 
diversos estados de fuerza de los reflejos de ingestión. En tanto nuestra 
medición del acto de ingestión es meramente tosca, puede ser satisfac- 
toria una burda explicación cualitativa; pero si estamos interesados 
en una medida cuantitativa más delicada de los diversos estados de 
la conducta de ingestión se requiere algo más. Las propiedades tem- 
porales e intensivas del hambre, reveladas en los experimentos descri- 
tos en este capítulo y en los siguientes, pueden apenas reconciliarse 
con la burda estimulación de las punzadas del estómago. Es difícil ver 
hasta qué punto una descarga aferente de cualquier tipo puede estar 
correlacionada con la fina gradación de fuerza que existe entre los am- 
plios extremos aquí presentados, pero en todo caso la estimulación res- 
ponsable de las punzadas ciertamente no puede hacerlo, ya que la 
existencia de los diversos estados de hambre pueden demostrarse en 
su ausencia (por ejemplo, después de haber ingerido una pequeña 
cantidad de comida). 

La estimulación procedente del estómago vacío no tiene una rela- 
ción directa con el hambre tal como lo tratamos en este capítulo. Pa- 
rece ser un mecanismo de emergencia que se pone en juego cuando 
la variación normal del hambre no ha sido efectiva para obtener co- 
mida. Se parece a cualquier estímulo nocivo que produce una actividad 
general y que refuerza toda conducta que lo hace desaparecer. El ham- 
bre no puede entrar en la presente formulación con las dimensiones 
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de un estímulo y sólo podría considerarse como tal incurriendo en una 
gran confusión. 

La existencia de un mecanismo especial en el caso del hambre ha 
conducido a un equívoco general sobre el papel de los demás impul- 
sos, cuya naturaleza, de lo contrario, hubiera quedado clara. Para en- 
contrar paralelismos al caso del hambre ha sido preciso forzar el tér- 
mino estímulo, como cuando Watson incluye dentro del término “todo 
cambio en los mismos tejidos tal como el que se obtiene cuando pri- 
vamos a un animal de la actividad sexual, cuando lo dejamos de ali- 
mentar o cuando le impedimos construir un nido” (76). Que Ocurre un 
cambio cuando privamos a un animal de su actividad sexual y que 
su efecto es la intensificación del impulso sexual es evidente; pero 
de ello no se desprende que este cambio sea un estímulo o que pro- 
porcione un estímulo. La búsqueda de estímulos que satisfacieran los 
requerimientos de otros impulsos, en general no se ha visto coronada 
por el éxito. En la presente formulación pasamos de la operación rea- 
lizada sobre el organismo a la propia conducta (por ejemplo, de la de- 
privación a un aumento de la fuerza del reflejo). En ningún momento 
es necesario suponer que la privación implica estímulos intermedios. 
El efecto del impulso sobre la conducta es semejante al de la emoción, al 
de ciertas drogas, al de la fatiga, la edad, etc. (Ver el cap. 11). La inferen- 
cia de estímulos adicionales es igualmente innecesaria en todos esos casos. 

La concepción del impulso como un estado en vez de como un es- 
tímulo es valiosa en cuanto evita las discusiones sobre el propósito. Un 
impulso no constituye una fuerza teleológica y el estímulo que actúa 
como un reforzamiento apropiado tampoco ejerce un efecto antes de 
que haya ocurrido. Esta concepción presta escaso apoyo a una drama- 
tización del carácter forzoso de la conducta. “De la misma forma que 
un hombre guía a un caballo”, dice Holt ([45], p. 232), “el mismo hom- 
bre se ve arrastrado a la acción por la irritación continua de sus órganos 
sensoriales, desde dentro y desde fuera”. Esta metáfora no brinda mu- 
cha ayuda a la hora de comprender la noción de estímulo o de impul- 
so. Un impulso no sólo no arrastra a un organismo desde el futuro, sino 
que ni siquiera lo empuja desde el pasado o el presente. 


El impulso y la reserva del reflejo 


Si he prestado especial atención al definir el concepto de la reserva 
del reflejo de la forma más clara posible, es porque, que yo sepa, no 
tiene ninguna contrapartida en el vocabulario popular de la conducta. 
La razón de ello es probablemente que se confunde fácilmente con la 
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motivación. Se dice que un organismo es capaz de conservar durante 
un período de tiempo no sólo una cierta cantidad de “conocimientos” 
sobre un acto, sino también un interés o impulso. La noción de reserva 
representa algo más que esas dos cosas. La cuestión del “mero cono- 
cimiento” —de si un organismo conserva o no la capacidad para reali- 
zar un acto requerido— es distinta de la cuestión de la capacidad de 
realizar el acto en ausencia de reforzamiento ulterior. El hecho de si 
el organismo realiza el acto, o no, generalmente, se considera como 
una cuestión de motivación, pero el papel condicionado de la conducta 
también puede verse afectado. En lugar de invocar, ordinariamente, 
la motivación como único factor, el principio de la reserva apunta a 
dos factores. No sólo puede modificarse la relación entre reserva y 
fuerza, sino que puede cambiarse el mismo tamaño de la reserva. En 
la conducta humana se plantean dos casos especiales en los que esta 
distinción es importante: uno se refiere a una reserva vacía, el otro a 
una reserva llena. En ciertas formas de neurastenia en que no parece 
que falle la motivación, la reserva puede hallarse vacía. Esta condición 
podría surgir de un reforzamiento ineficaz, ya sea porque pocos o nin- 
gún estímulo posean poder reforzante, ya sea porque, como sucede a 
menudo en la vida diaria, el reforzamiento es remoto con respecto al 
acto. Esas dos circunstancias podrían originar una incapacidad de res- 
puesta sin modificar el impulso en modo alguno. El caso opuesto de 
una reserva llena plantea la cuestión de la sublimación y parece res- 
ponder la objeción de que la conducta de sublimación en última ins- 
tancia es incapaz de modificar (“de satisfacer”) un impulso. La conducta 
de sublimación, evidentemente, constituye un ejemplo de inducción 
topográfica. Su efecto no es un cambio de impulso, sino el vaciado de 
la reserva. El estado de “tensión” que origina la conducta de sublima- 
ción no sólo constituye un impulso intenso, sino que representa una 
reserva llena que, a causa de circunstancias externas o internas, no pue- 
de vaciarse, sino mediante inducción topográfica. No obstante, estas 


cuestiones constituyen problemas que caen fuera del ámbito de este 
libro. 


El impulso como «inhibición» 


Como un cambio de impulso implica, a menudo, un debilitamiento 
de un reflejo, no es sorprendente que algunos ejemplos, ocasionalmente, 
hayan sido designados como casos de “inhibición”? No creo que haya 


2. Cf, Anrep, G. V. (25), quien, cuando habla de “inhibición espontánea” 
parece referirse a un debilitamiento del reflejo salivar debido a la ingestión o 
a un trastorno gástrico. 
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necesidad de repetir que si la inhibición se refiere simplemente a una 
disminución de fuerza, es un término demasiado amplio para poseer al- 
guna utilidad. Salvo en lo que respecta al sentido del cambio, el im- 
pulso tiene muy poco en común con la extinción, la emoción, o con 
cualquier otro factor que produzca un descenso de fuerza. 


El impulso y el concepto de reflejo 


La presente formulación del impulso tiene una repercusión sobre 
la extensión general del principio del reflejo a la conducta del organis- 
mo intacto. En un estudio realizado sobre el concepto del reflejo (2) he 
señalado que la propiedad definitoria central que ha regido el uso del 
término no es la presencia de estructuras neurológicas, sino el some- 
timiento a leyes de la relación entre estímulo y respuesta que ha hecho 
plausible la inferencia de la estructura y la función neurológicas. La 
creciente ampliación del campo del reflejo (compárese la extensión del 
concepto a la conducta adquirida, por parte de Pavlov) ha avanzado no 
a base de descubrimientos neurológicos, sino gracias a nuevas demos- 
traciones de la existencia de leyes. 

En ningún reflejo la provocación de una respuesta por un estímulo 
es inevitable, pero en el caso de los reflejos espinales las operaciones 
que modifican la provocación son evidentes. Así, es fácil considerar el 
reflejo de flexión como sometido a leyes, aun cuando el estímulo no 
provoque la respuesta después de una gran fatiga, porque el estado de 
fatiga ha sido inducido claramente por el experimentador. La evidencia 
de las operaciones que afectan a los reflejos espinales explica por qué 
se descubrieron primero. Pero, de acuerdo con nuestro punto de vista, 
cualquier respuesta del organismo está asimismo comparablemente so- 
metida a leyes, aunque las variables responsables de las diferencias de 
fuerza no puedan ser identificadas o controladas tan fácilmente. Entre 
las variables más difíciles de definir en la conducta del organismo in- 
tacto, el impulso ocupa un lugar preeminente. El concepto de “voli- 
ción”, en su oposición histórica al reflejo “involuntario”, descansa en 
gran parte en los cambios “espontáneos” de fuerza que cabe explicar 
mediante operaciones que caen dentro del campo del impulso. Si con- 
seguimos controlar estas variables adicionales podemos extender el 
término de reflejo (en su implicación de predictibilidad) a la conducta 
en general. El viejo estudio de los reflejos espinales y el moderno es- 
tudio de la conducta, tanto lógicamente como en gran medida históri- 
camente, no tienen solución de continuidad. 
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10. Impulso y condicionamiento: 
la interacción 
de dos variables 


El problema 


Las observaciones en que se basan los conceptos de impulso y con- 
dicionamiento son esencialmente del mismo tipo. En lo que se refiere 
a un solo reflejo cualquiera, observamos simplemente un cambio en 
su fuerza que ocurre como consecuencia de la manipulación de alguna 
variable. Estas variables pueden dividirse en clases llamadas “impul- 
so” y “condicionamiento”, pero sus efectos sobre la conducta en sí 
misma considerada, no brindan ningún criterio útil para su diferencia- 
ción. Sólo cuando pasamos de la fuerza inmediata de un reflejo a su 
reserva, se revela una diferencia. El condicionamiento afecta al tama- 
ño de la reserva, pero el impulso se refiere a la relación entre el ta- 
maño y la fuerza del momento. La operación del reforzamiento aumenta 
la reserva de una forma clara, mientras que la operación de la alimen- 
tación o el ayuno cambia la fuerza sin influir en la reserva. El el capí- 
tulo 1 ya formulamos más o menos dogmáticamente esas relaciones, y 
ya es hora de confirmar dichas formulaciones con evidencia experi- 
mental, 

Ahora llegamos a una segunda etapa en la investigación de la con- 
ducta. Hasta ahora nos hemos limitado, en la medida de lo posible, a 
variables aisladas, pero en lo sucesivo vamos a estudiar la manipulación 
de dos variables a la vez. La interacción de las variables es importante 
porque quizá no hay nada en la ciencia de la conducta que posea en 
realidad la condición de una variable completamente aislada. Aunque 
es posible mantener el impulso constante durante el condicionamiento 
o la extinción, de ello no se desprende que el estado en que se mantie- 
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ne el impulso no sea significativo para el resultado final. Consideremos 
el caso de la provocación no reforzada que produce extinción. En la 
conducta operante el proceso de extinción depende de la tasa de pro- 
vocación, Pero ésta es controlada por el impulso, y la forma de la curva, 
por consiguiente, depende del grado de impulso arbitrariamente es- 
cogido. Éste es el tipo de problema que vamos a examinar. 


El estado del impulso y la dinámica de la extinción 


En el capítulo anterior sostuvimos que la noción de impulso se ba- 
saba en la observación de los diversos cambios de fuerza de un reflejo 
después de un determinado tipo de operación y que una medida apro- 
piada del impulso era la fuerza. Recurriendo a la noción de reserva, 
podemos suponer que en la curva normal de ingestión la reserva sigue 
llena. Cada respuesta se ve reforzada, y aunque la tasa declina con la in- 
gestión, se podría obtener del organismo un número máximo de respues- 
tas aumentando el impulso y extinguiendo el reflejo. Por ello, se ha 
sostenido que el efecto del impulso reside en cambiar la proporcionalidad 
de la tasa y la reserva. Ahora bien, no hay razón para limitar esta rela- 
ción a las respuestas reforzadas. Se debiera aplicar, asimismo, a la tasa 
de provocación durante la extinción y debiera dar la relación a que nos 
hemos referido en el párrato anterior. 

La formulación matemática rigurosa del proceso de la extinción a 
un impulso dado se ve complicada por el hecho de que la extinción 
normalmente no se completa * dentro de un espacio de tiempo durante 
el cual pueden mantenerse constantes el impulso y otras variables. El 
caso mejor es el de la extinción original, que es breve; pero estas cur- 
vas se ven complicadas por un factor emocional. La extinción después 
de recondicionamiento periódico es un proceso más uniforme, pero 
puede requerir muchas horas. He seguido el sistema de tomar me- 
diciones de una hora, a lo largo de días sucesivos, cuando el impulso 
puede controlarse adecuadamente; pero en este caso, entra en juego 
el proceso del restablecimiento espontáneo como otra complicación. En 
vista de estas dificultades, en el momento presente, una formulación 
teórica no puede ser más que una burda aproximación. 

La noción de reserva y la forma de la curva de extinción usual su- 
gieren la hipótesis de que la tasa de respuesta en cualquier momento 


- 


í. De la forma de la curva (así como de la presente interpretación) se des- 
prende que el proceso nunca se completa. Por razones prácticas hemos adoptado 
como punto final una tasa de respuesta arbitraria cerca de cero. 
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dado es proporcional a la reserva restante. Pueden establecerse curvas 
teóricas basadas en esta hipótesis que se aproximen muy de cerca a 
las curvas experimentales. En la figura 184 hemos supuesto la existen- 
cia de una reserva total como viene indicado por la línea horizontal 
de la parte superior del gráfico. La curva A se obtiene suponiendo la 
existencia de una clara relación entre la tasa de respuesta (la pendiente 
de la curva) y la reserva restante. Por supuesto, ello no constituye más 
que uno de los casos posibles, que dependen del tamaño de la reserva 


Ficura 134 
CURVAS TEÓRICAS DE EXTINCIÓN CON DIFERENTES IMPULSOS 


Las curvas se basan en el supuesto de que la tasa de respuesta es proporcional a 
las respuestas que aún permanecen en la reserva y de que el efecto del impulso 
consiste en cambiar la proporcionalidad 


y de la proporcionalidad entre la tasa y la reserva supuesta. Esta curva 
se puede comparar favorablemente con curvas experimentales reales, 
como las de la figura 26. 

La principal cualificación que debemos imponer sobre este esquema 
es el hecho, deducible del proceso del restablecimiento espontáneo, de 
que la reserva no está plenamente disponible en cualquier momento 
para influenciar la tasa. Esta cualificación es de poca monta con res- 
pecto al grado de aproximación que aquí intentamos. A pesar de ello, 
la hipótesis nos permite considerar con provecho el efecto de un cam- 
bio de la proporcionalidad de la tasa y la reserva sobre la curva de 
extinción. 

En las curvas B y C representamos dos casos obtenidos al reducir la 
proporcionalidad. Las curvas empiezan con pendientes suaves a causa 
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del impulso reducido, pero como la reserva se ve drenada menos rá- 
pidamente la tasa cae más lentamente. Al final del período representado 
en la figura, los impulsos más bajos presentan las tasas más altas, aun- 
que, desde luego, esto no sucedería si la tasa inicial fuera demasiado 
baja. El caso límite al que se puede llegar con la reducción del impulso 
es el de la saciedad completa en el que no ocurre respuesta alguna 
y, por tanto, no se produce tampoco extinción alguna. 

Para investigar el efecto de un impulso menor necesitamos algún 
dispositivo que reduzca el impulso “normal” a otros grados determi- 
nados y conocidos. Para el propósito de este experimento nos pareció 
satisfactoria la siguiente técnica: Se estableció el impulso normal a 
base del método usual de alimentar a las ratas una vez por día durante 
un período limitado (en este caso, una hora). Con este valor estable 
del impulso como base nos fue posible obtener valores más bajos dan- 
do a la rata cantidades determinadas de comida o alimentándola du- 
rante períodos determinados de tiempo poco antes del experimento. Los 
dos métodos conducen al mismo resultado, pues con un hambre cons- 
tante inicial la cantidad ingerida está en función del tiempo. Práctica- 
mente, es mejor emplear una cantidad de comida en lugar del tiempo, a 
causa de las posibles variaciones temporales de tasa. Sólo es necesario 
determinar las cantidades que producirán, en cada caso, los grados 
deseados de impulso. 

En algunos de los experimentos siguientes, la cantidad a ingerir se 
colocó en el aparato. Cuando empezó el experimento, la rata primero 
ingirió la comida y luego pasó a realizar el experimento. Los aparatos 
se usaron con grupos sucesivos de animales, y este método consumió 
Una gran cantidad de tiempo suplementario, especialmente cuando se 
ingerían grandes cantidades de comida. Por lo tanto, se ideó un método 
alternativo. Durante un período de tiempo anterior al experimento de- 
terminado por la cantidad de comida a ingerir, se colocaba a cada rata 
en una jaula separada con comida. Haciendo empezar a los miembros 
de cada grupo en momentos diferentes era posible conseguir que ter- 
minaran sus diferentes raciones aproximadamente al mismo tiempo, 
cuando se iniciaba el experimento propiamente dicho. El segundo 
método evita la desventaja del primero, en que, si la rata dejar caer 
accidentalmente parte de la comida y no la vuelve a recoger, puede 
empezar el experimento prematuramente, 

Se utilizaron curvas de extinción después de reforzamiento periódi- 
Co, pues raras veces se ven marcadas por los trastornos emocionales 
que caracterizan a la extinción original. Se tomaron quince ratas pro- 
cedentes de otros experimentos en los que habían sido sometidas a re- 
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condicionamiento periódico durante diversos períodos de tiempo.? El 
intervalo de recondicionamiento fue de cinco minutos en cada caso. 
Inmediatamente antes del primer período experimental en que se ob- 
servó extinción, se variaron los impulsos dando a la rata cantidades 
de cero, dos, cuatro y seis gramos. El efecto de estas cantidades sobre 
la curva queda claramente indicado en los experimentos que citare- 
mos más adelante, en este mismo capítulo, Se asignó cada uno de los 
impulsos a un animal de cada grupo (en el grupo de tres se prescindió 
del impulso de seis gramos). Se obtuvo el registro de un día de ex- 
tinción a un impulso reducido. En el segundo y tercer días de extinción 
no se dio a la rata alimento alguno antes del experimento. El efecto del 
retorno a un impulso normal nos proporciona información adicional 
acerca de la hipótesis principal. 

Los promedios resultantes de las 15 ratas vienen representados grá- 
ficamente por medio del conjunto de curvas de la parte inferior de la 
figura 135. En el primer día del gráfico indicamos la tasa media bajo 
recondicionamiento periódico correspondiente a los dos días anterio- 
res a la extinción, y en el segundo, las curvas de extinción medias a los 
diferentes grados de impulso. Se hicieron cuatro mediciones de las al- 
turas con objeto de seguir el cambio durante la hora. El tercero y el 
cuarto días del gráfico muestran la continuación de las curvas a un 
impulso máximo, siendo sólo medidos los puntos finales. En su forma 
original los datos son difíciles de interpretar debido a que el efecto del 
impulso se ve oscurecido, hasta cierto punto, por la influencia de las 
pendientes periódicas previas, que diferían ligeramente. Como ya he- 
mos mostrado, y como puede inferirse de la relación de la tasa con 
la reserva, la pendiente de la curva de extinción está en función de la 
pendiente periódica. Podemos hacer una tosca corrección multiplicando 
los datos de cada grupo por un factor escogido para convertir la tasa 
periódica en algún valor arbitrario. En este caso se utilizó el valor del 
grupo de cero gramos, siendo los factores necesarios 0.00, 1.82, 1.15 
y 1.14 para los grupos de cero, dos, cuatro y seis gramos, respectiva- 
mente. En el grupo de la parte superior de la figura 185 (pág. 389) 
damos las curvas resultantes, en que el efecto predicho en la figu- 
ra 134 queda mostrado claramente. (Hay que advertir que los factores 


2. Cuatro ratas procedían de un experimento sobre el efecto de un intervalo 
de tiempo antes del reforzamiento, con 23 días de reforzamiento periódico; tres de 
un experimento similar que duró 19 días (la cuarta rata de este grupo había 
muerto accidentalmente); cuatro de un experimento similar de 22 días de duración; 
y cuatro de un experimento sobre recondicionamiento periódico en que durante 10 
días se reforzaron diversas cantidades de respuestas sucesivas de cada período. 
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elegidos para esta corrección se basan en los datos disponibles antes 
del inicio de la extinción.) 

La curva de cero gramos de esta figura es típica de la curva de 
extinción descrita en el capítulo 4 y viene representada por la cur- 
va A de la figura 134. Una de sus características es que empieza 
a una tasa considerablemente más alta que la observada bajo el recon- 
dicionamiento periódico anterior. El efecto de la reducción del impulso 
consiste en disminuir la pendiente de la curva. La tasa inicial muestra 
un descenso congruente correspondiente a los aumentos de la cantidad 
de comida previamente ingerida. Sin embargo, el descenso no está en 


RESPUESTAS 


PERÍODOS EXPERIMENTALES DIARIOS 


Ficura 135 1 
Erecro DEL IMPULSO REDUCIDO SOBRE LA EXTINCIÓN 


Las curvas de la parte inferior proporcionan los datos originales; las de la parte 
superior se han corregido para tener en cuenta las diferencias entre las tasas bajo 
reforzamiento periódico 
Al primer día de la extinción (día 2 de la figura) se redujeron los impulsos dando 
a la rata cantidades de comida poco antes del experimento, tal como viene indicado 
en gramos en cada curva. En los dos últimos días los impulsos fueron normales. 
La curva de trazos representa el caso hipotético en que el impulso es tan bajo que 
no ocurre respuesta alguna 
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función lineal de la cantidad, sino que al principio es mucho más brus- 
co. Las curvas con impulsos más bajos carecen de la curvatura de las 
de la figura 184, pero muestran la aceleración negativa más lenta. 

Al día siguiente, con el impulso normal, la curva de cero gramos de- 
clina como de costumbre, pero las demás muestran un aumento de tasa, 
no sólo por encima de sus valores previos con los impulsos reducidos, 
sino también por encima del registro contemporáneo del grupo de cero 
gramos. De la hipótesis cabe esperar este incremento, que es tanto más 
pronunciado cuanto más bajo es el impulso. 

En esos experimentos las curvas de extinción no se continuaron con 
impulsos reducidos el tiempo suficiente para comprobar la aparición 
final de un número de respuestas constante máximo en cada caso. Pero 
al volver a un impulso completo al segundo día, aparece el mismo 
efecto de una forma acelerada. El efecto de un cambio de impulso 
sobre la familia de curvas de la figura 185 consiste en posponer la 
aparición de algunas de las respuestas que se hubiesen provocado al 
primer día de la extinción y desplazar así el cuerpo de la curva hacia 
la derecha. Hemos introducido en el gráfico, con líneas de trazos, un 
caso límite que ilustra este desplazamiento. Aquí el impulso del pri- 
mer día de la extinción se supone tan bajo que no ocurre respuesta 
alguna. Por consiguiente, no se produce extinción y, al día siguiente 
(siendo ahora el impulso normal), la curva empieza, desde el principio, 
exactamente como a cero gramos al primer día. En este caso la curva 
entera se ha desplazado un día hacia la derecha. En el de seis gramos 
se muestra claramente un efecto similar. El bajo impulso del primer 
día de la extinción permite que aparezca sólo un pequeño número de 
respuestas. El proceso de extinción, por lo tanto, mo avanza mucho, y 
al segundo día (con el impulso completo), la tasa es relativamente alta. 
Un efecto similar es detectable en los otros dos grupos con impulso 
reducido. Sin embargo, el grupo de cuatro gramos se está aproximando 
claramente a una asíntota más baja, lo cual puede significar que la 
corrección no es plenamente adecuada o que hay una diferencia debida 
al muestreo. 


Ya mostraremos más tarde que el impulso normal mantenido por la 
alimentación diaria durante un tiempo limitado es tal vez sólo un 
cuarto o un quinto del impulso máximo presentado durante un estado 
extremo de hambre. Por tanto, debemos considerar qué efecto tendría 
sobre la curva de extinción normal mostrada en los experimentos ante- 
riores un nuevo aumento del impulso. La figura 134 da los efectos es- 
perados de un incremento de impulso en las curvas D y E. Si la hipó- 
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tesis se mantiene, debería haberse dado un gasto aún más rápido al 
principio de la curva, seguido de un descenso necesariamente brusco 
hasta una baja tasa de emisión. No hemos realizado experimentos de- 
liberados sobre este punto, pero se obtuvieron accidentalmente * unas 
cuantas curvas de extinción con impulsos máximos, o casi máximos, en 
experimentos similares a los que vamos a citar más adelante. 

En la figura 136 mostramos dos curvas de extinción con impulsos 
casi máximos. Las ordenadas están reducidas como en el experimento 
que describiremos después, pero hemos añadido una línea de trazos a 
la curva B para indicar su posición sobre las coordenadas usuales. Está 
claro que el resultado esperado es el que realmente se ha obtenido. 
La reserva se vacía rápidamente y sigue una tasa de respuesta muy 
baja. Sin duda alguna se observaría cierta respuesta adicional en un 
segundo día, ya que la fuerza, hasta cierto punto, se restablecería espon- 
táneamente. Hacia el fin de la curva A aparece una huella de ulterior 
respuesta, 

Si suponemos que la futura respuesta después del restablecimiento 
es ligera, las curvas de la figura 136 debieran compararse con las de 
la figura 39. El número total de respuestas emitidas por la rata en el 
último caso durante cinco días de extinción es aproximadamente igual 
al de la figura 136. La diferencia de las formas de las curvas del primer 
día de extinción demuestra el efecto esperado del impulso máximo. En 
las dos reservas existen aproximadamente el mismo número de respues- 
tas, pero en el caso de la figura 1836 se vacían mucho más rápidamente. 

Este rápido drenaje de la reserva se asemeja al que tiene lugar des- 
pués del establecimiento de una discriminación temporal bajo refor- 
zamiento a una razón fija, como podemos ver comparando las presen- 
tes curvas con las de la figura 95. Las razones de la rápida tasa inicial 
son diferentes en los dos casos, pero el resultado es aproximadamente 
el mismo. 


El efecto del impulso sobre las curvas de extinción original es más 
difícil de seguir a causa de las desviaciones relativamente graves que 
las caracterizan. Sin embargo, podemos obtener alguna indicación del 
efecto del hambre, indicación que es acorde con la interpretación antes 
avanzada. Se condicionaron doce ratas de unos 130 días de edad, de la 
forma usual, y se reforzaron 20 respuestas. En cada uno de los dos 
días sucesivos se reforzaron 20 respuestas más. Después de dos días 


3. Se obtiene una curva accidental cuando se atasca el almacén o cuando falla 
el mecanismo del aparato, como sucede a menudo. 
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RESPUESTAS 


TIEMPO (UNA HORA) 


Ficura 136 
Dos CURVAS DE EXTINCIÓN DE IMPULSOS CASI MÁXIMOS 


Se han reducido las coordenadas para dar cabida a la elevada tasa. La curva de 
trazos indica la posición de la curva B en las coordenadas usuales 
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durante los cuales se alimentó a las ratas en sus jaulas a la hora expe- 
rimental, se obtuvieron curvas de extinción. Inmediatamente antes del 
inicio del experimento se dio comida a las ratas en una jaula separada 
de la forma siguiente: a cuatro ratas, cero gramos; a dos ratas, dos 
gramos; a cuatro ratas, cuatro gramos, y a dos ratas, seis gramos. En 
la figura 187 damos un registro representativo de cada grado de ham- 
bre, El curso de cada curva viene indicado por una línea discontinua, 
que ofrecemos, no como una curva teórica, sino simplemente para mos- 
trar más claramente el carácter de la curva experimental. 


K=|00=3] 


RESPUESTAS ' 
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FicuraA 137 Y 


EXTINCIÓN ORIGINAL CON DIFERENTES IMPULSOS 


Tal como viene indicado en gramos en cada curva, se suministraron a las ratas 
diferentes cantidades de comida antes del experimento 


La característica más importante de la extinción original que per- 
mite distinguirla de la extinción bajo recondicionamiento periódico es 
la velocidad. Bajo las condiciones de este experimento la mayor parte 
de cambio de fuerza, normalmente, finaliza al cabo de una hora. Así, 
la curva de cero gramos de la figura 137 al final del período se apro- 
xima, muy de cerca, a una tasa de respuesta cero. A menos que la pos- 
posición de las respuestas por la reducción del impulso sea demasiado 
grande, deberíamos poder obtener, en su forma completa y dentro de 
una hora, una familia de curvas similar a la que en la figura 135 se 
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interrumpió por el retorno a un impulso máximo. Con la excepción de 
la curva de seis gramos, esto es lo que sucede. Con el grado de apro- 
ximación restante, a pesar de la irregularidad, es evidente en la figu- 
ra 187 que los animales alcanzan una baja tasa de respuesta al final 
de la hora. Asimismo, es evidente que esto se logra a pesar de una 
progresiva reducción de la tasa inicial debida a la reducción del im- 
pulso. Así, pues, las curvas están más o menos acordes con el supuesto 
de que la altura final no se ve afectada por el impulso, y que el único 


RESPUESTAS 


MINUTOS 
Ficura 138 


CURVAS MEDIAS DE EXTINCIÓN ORIGINAL CON DIFERENTES IMPULSOS 


Las curvas inferiores representan los datos originales. Las curvas superiores se 

obtuvieron multiplicando los valores de las curvas inferiores por factores elegidos 

para hacer converger sus puntos terminales. El impulso se redujo dando a la ratas 
cantidades de comida que vienen indicadas en gramos para cada curva 


efecto consiste en la modificación de la relación entre la tasa de res- 
puesta y el número de respuestas que aún no se han provocado. En 
el caso de los seis gramos, parece obvio que la curva se ha pospuesto 
demasiado tiempo para aparecer en el período experimental. 

En la figura 138 damos las medias de todos los registros del grupo. 
Como las desviaciones de las curvas de este tipo siempre se producen 
en la misma dirección (por debajo de la envolvente), una media no lo- 
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graría corregirlas. Una media es apenas más útil que una curva única, 
excepto en el hecho de que sirve para expresar el resultado para todo 
el grupo. En el caso de los datos primarios de la figura 188 (curvas 
inferiores), el efecto del cambio del impulso, una vez más, no queda 
mostrado muy claramente a causa de las diferentes pendientes de los 
cuatro grupos y, desgraciadamente, no es posible hacer una simple co- 
rrección, como en el caso de la extinción después de recondicionamien- 
to periódico, porque no disponemos de datos anteriores de que partir. 
El número de respuestas que deben ser provocadas como consecuencia 
del condicionamiento no está simplemente en función del número de 
los reforzamientos precedentes cuando éstos ocurren agrupados conjun- 
tamente. Los organismos difieren bastante ampliamente en sus razones 
de extinción, y en las alturas de las curvas originales después de cantida- 
des de condicionamiento comparables. Por consiguiente, es imposible 
predecir por anticipado cuál va a ser la altura de una curva de extin- 
ción original. Sin embargo, si suponemos que al cabo de la hora va a 
alcanzarse la misma altura (llamando la atención sobre la improbabili- 
dad del supuesto para el caso de los seis gramos), podemos multiplicar 
todos los valores por factores elegidos para hacer converger los puntos 
finales en algún punto arbitario (por ejemplo, el valor de cero gramos). 
Esto es lo que hemos hecho con el grupo superior de curvas de la fi- 
gura 138, en que los factores requeridos fueron 0.00, 0.93, 1.83 y 138. 
Pueden observarse los efectos característicos del cambio de impulso 
que ya he notado en relación con los registros individuales. 

Por supuesto, debería realizarse un experimento más elaborado para 
determinar si el número de respuestas obtenido en la extinción es com- 
pletamente independiente del impulso. Los experimentos precedentes 
carecen de los controles necesarios para zanjar la cuestión definitiva- 
mente, aunque indican que no hay una diferencia muy grande en el 
número total de respuestas obtenido con impulsos altos o bajos. Pode- 
mos concluir provisionalmente que el efecto del no-reforzamiento de 
una respuesta es independiente del impulso. En términos vulgares, “Ja 
imposibilidad de recibir un gránulo significa lo mismo para una rata 
ligeramente hambrienta como para una que esté muy hambrienta”. En 
ambos casos, se sustrae una sola respuesta de la reserva. Pero esto no 
es lo que sucede con el efecto del reforzamiento, como veremos gracias 
a los experimentos que expondremos a continuación. 
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El impulso y la razón de extinción 


Ya mostramos en el capítulo 4 que la tasa de respuesta constante 
observada bajo reforzamiento periódico variaba con la frecuencia del 
reforzamiento. Pero esta tasa, como cualquier otra, también debiera 
variar con el impulso, y, por lo tanto, sería conveniente revelar, con cla- 
ridad, la interacción entre impulso y condicionamiento, en una investi- 
gación de la relación de la tasa bajo una frecuencia de reforzamiento 
dada con las operaciones de alimentación y de ayuno. Las tasas de res- 
puesta descritas en el capítulo 4 existían bajo el impulso normal, man- 
tenido por la alimentación de la rata una vez al día durante una hora y 
media. Como en el caso de las curvas de extinción, deben investigarse 
los grados de hambre que se sitúan por encima y por debajo de este 
valor normal. 

En el primer experimento que vamos a describir, el hambre se redu- 
jo proporcionando a la rata cantidades determinadas de comida inme- 
diatamente antes del experimento, como en el experimento ya descrito. 
Los resultados de los tres grupos de ratas fueron los siguientes: 


GRUPO A. Se experimentó con cuatro ratas, de 105 días de edad al 
principio del experimento, sometiéndolas a los cuatro impulsos resul- 
tantes de la administración de cero, dos, cuatro y seis gramos de comi- 
da. Se colocó la comida en el aparato y ésta fue ingerida por la rata 
antes de provocar las respuestas a la palanca. En lo sucesivo se reforza- 
ron periódicamente las respuestas a lo largo de una hora. Cada rata se 
sometió a experimentación, varias veces con cada impulso, siguiendo 
un orden al azar durante los 16 días del período experimental. De los 
64 registros obtenidos, dos de ellos se perdieron a causa de fallos téc- 
nicos de procedimiento o del aparato. Los 62 restantes se distribuyeron 
de la manera siguiente: 16 a cero gramos, 15 a dos gramos, 15 a cuatro 
gramos y 16 a seis gramos, aportando cada rata tres o cuatro registros 
a cada grupo. 

Las tasas medias de los cuatro impulsos, expresadas en respuestas 
por hora, vienen dadas por los círculos blancos de la figura 189 (pági- 
na 406). La relación entre la tasa y la cantidad de comida ingerida es, 
más o menos, lineal. El ajuste mejor con una línea recta extrapola 
hasta un valor excesivamente alto para la cantidad de comida necesa- 
ria para llevar la tasa al punto cero. La línea trazada a través de los 
puntos en la figura tiene en cuenta una extrapolación mucho más ra- 
zonable. 
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GRUPO B. Se sometieron a experimentación cuatro ratas (de edad 
desconocida, pero probablemente de unos cinco meses) con impulsos si- 
milares. Se colocó la comida en el aparato y las ratas la ingirieron an- 
tes de responder a la palanca. En este grupo se dio cada cantidad de 
comida a una sola rata durante dos días sucesivos; pero después, las 
cantidades se variaron al azar, aportando cada rata una serie de regis- 
tros con cada uno de los impulsos. De este grupo se obtuvieron cua- 
renta registros de períodos de una hora cada uno. Cuatro de ellos se 
echaron a perder a causa de fallos técnicos. Los 36 restantes se distri- 


RESPUESTAS POR HORA 


GRAMOS DE COMIDA 
PREVIAMENTE INGERIDOS 


FIGURA 189 19 


TASA DE RESPUESTA BAJO REFORZAMIENTO PERIÓDICO EN FUNCIÓN DE LA CANTIDAD 
DE COMIDA INGERIDA ANTES DEL EXPERIMENTO 


Las curvas inferiores corresponden a los grupos de cuatro ratas cada uno. La curva 
superior representa el promedio de los tres grupos 


buyeron de la manera siguiente: 10 a cero gramos, 11 a dos gramos, 
12 a cuatro gramos y 3-a seis gramos. En este grupo, seis gramos de 
comida redujeron la tasa a un valor tan bajo que se observó una con- 
siderable irregularidad y, por consiguiente, el experimento se limitó 
principalmente a los valores más altos del impulso. El valor del resul- 
tado del impulso de seis gramos, evidentemente, no debe ser tomado 
plenamente en cuenta. En los círculos negros inferiores de la figura 139 
damos los promedios de todos los impulsos. Como se puede ver, la tasa 
declina en función lineal de la cantidad recibida, y en este caso se ob- 
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tiene una mejor adaptación. En la figura 140 (pág. 407) damos mues- 
tras de registros diarios de una rata con los cuatro impulsos. 


GRUPO C. Se sometieron a experimentación de forma similar, tres 
ratas de la misma edad que las del grupo B. De este grupo se obtu- 
vieron treinta registros de una hora cada uno. No se echó a perder 
ninguno de ellos por razones técnicas, pero tres de ellos —que omitimos 
aquí— se tomaron con impulsos atípicos por razones de exploración. 
Los 27 registros restantes se distribuyeron de la forma siguiente: nue- 
ve de cero gramos, ocho de dos gramos, y diez de cuatro gramos. Dos 


RESPUESTAS 


MINUTOS ¡¿£— 30 —>] 
Ficura 140 * 
CUATRO REGISTROS DIARIOS DE UNA RATA DE LA FIGURA 139, Grupo B 


Indicamos en gramos las cantidades de comida ingeridas poco antes de los experi- 
mentos. Nótese que las curvas siguen siendo esencialmente lineales 


registros exploratorios de seis gramos mostraron que con el impulso 
resultante la tasa era demasiado baja para proporcionar un resultado 
satisfactorio. Los promedios de todos los impulsos vienen dados en los 
círculos blanquinegros de la figura 139. Las tasas de este grupo están 
considerablemente por debajo de las de los grupos A y B, pero mues- 
tran aproximadamente la misma relación lineal con la cantidad pre- 
viamente ingerida. En la figura 141 (pág. 408) damos registros de 
muestra de una rata con los tres grados de impulso. 

Representamos los promedios de los tres grupos en la curva superior 
de la figura 139. No debe considerarse que el punto de seis gramos 
tenga la misma importancia, a causa de la ausencia de un valor en el 


407 


caso del grupo C, lo cual eleva el promedio, ya que la extrapolación 
de este grupo pasa por debajo del promedio de los otros dos. Con los 
impulsos más altos, sin embargo, el promedio sirve para reducir la dis- 
persión que resulta de la dimensión reducida de las muestras y para 
revelar, más claramente, la relación. Al evaluar el gráfico hay que ad- 
vertir que incluye todos los registros hechos durante el experimento. 
con las pocas excepciones ya mencionadas. 


Este experimento nos permite comprobar si el grado de impulso al- 
canzado dando a la rata parte de una ración diaria, permanece, o no, 


RESPUESTAS 


MINUTOS 


FicurA 141 19 
TRES REGISTROS DIARIOS DE UNA RATA DE LA FIGURA 139. Grupo C 


Indicamos en gramos las cantidades de comida ingeridas poco antes de los ex- 
perimentos 


constante durante algún tiempo después. Cabría esperar que la digestión: 
de la comida ya ingerida ocasionara un cambio posterior, pero no es 
así. Este cambio produciría una curvatura de los registros durante la. 


TABLA 10 


CURVATURA CON LOS DIFERENTES IMPULSOS (EN PORCENTAJES) 


Gramos administrados 0 9 4 6 
GIUPO Á coco. 0.0 + 8.5 NE 0.0 
COMBO ss + 2,2 — 4.7 — 8.6 — 
Grupo Coon. —0.5 + 0.9 +45 — 
Promedio * ......... + 0.6 + 1.6 + 1.2 0.0 


* Se han tenido en cuenta los signos 
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hora. Si medimos la altura de un registro diario a la mitad y al final 
de la hora, la primera altura debería ser la mitad de la segunda si la 
curva fuera una línea recta. Las desviaciones del valor medio espe- 
rado pueden expresarse en porcentajes. Las curvaturas medias de to- 
dos los registros juntos según los impulsos vienen dados en la tabla 10. 
Los valores medios son nulos o ligeramente positivos y en ningún caso 
son significativos. Incluso en el caso de las bajas tasas que se obtienen 
bajo seis gramos, los registros son líneas rectas. Por consiguiente, queda 
demostrado que si se interrumpe a una rata durante la ingestión de una 
ración diaria de comida, el grado de hambre existente en aquel mo- 
mento persistirá sin cambio significativo durante al menos una hora. 
Omitimos el posible efecto de 12 gránulos de comida administrada pe- 
riódicamente durante la hora, que tienen un peso total de un poco más 
de medio gramo. 

A primera vista, por Supuesto, parece que nos estemos mordiendo la 
cola. Primero intentamos descubrir si el grado de impulso tiene algún 
efecto sobre la pendiente periódica; luego usamos la pendiente perió- 
dica para mostrar que el impulso es constante durante una hora. Pero 
la circularidad es sólo aparente. Mostramos que podemos producir un 
descenso de tasa permitiendo la ingestión de comida o, de un día para 
otro, incrementar la tasa suspendiendo la administración de comida. 
Luego mostramos que durante la hora no tiene lugar ningún cambio 
similar al que sería producido por más alimentación o ayuno. 


La tasa de respuesta a niveles de hambre por encima de lo nor- 
mal puede investigarse siguiendo el cambio que se produce cuando 
se deja morir de hambre a la rata. Hemos realizado experimentos so- 
bre este punto en colaboración con el profesor W. T. Heron. Se obtu- 
vieron datos sobre trece ratas que tenían 150 días de edad al principio 
del experimento, con la excepción de cuatro ratas de unos 100 días de 
edad. El aparato y el método fueron esencialmente los ya descritos. Los 
períodos experimentales fueron de una hora de duración. Con excep- 
ción del período experimental, las ratas se mantuvieron en un armario 
a una temperatura constante de 25% C. En todo momento tuvieron 
agua a su disposición. 

Con el permiso del profesor Heron cito con ligeros cambios el in- 
forme publicado de esos experimentos (22): 


El día anterior a la iniciación del período de muerte por inanición, 
se permitió continuo acceso a las ratas a la comida durante 24. horas. A 
partir de aquel momento no se les dio comida alguna con excepción de 
la necesaria para recondicionarlas. Como el intervalo de recondicionamien- 
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to era de cuatro minutos y el período experimental diario de una hora, 
cada animal recibía una ración diaria de unos 15 gránulos, o sea una 
masa total de 0,7 gramos, aproximadamente. Bajo estas condiciones los 
animales fueron sometidos a experimentación diariamente hasta su muer- 
te por inanición. Originalmente, no teníamos la intención de llevar el 
experimento hasta este punto, pero cuando el curso del cambio se hubo 
establecido claramente, los animales ya no pudieron salvarse. 

En términos generales, los resultados pueden formularse como sigue: 
el número de respuestas por hora aumenta con el período de ayuno has- 
ta que se alcanza una tasa máxima. Después de este punto ocurre un 
descenso relativamente rápido de la tasa hasta que se produce la muerte 
por inanición, 
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CAMBIO DE LA TASA MEDIA DE RESPUESTA BAJO RECONDICIONAMIENTO PERIÓDICO 
DURANTE UN PERÍODO DE AYUNO PROLONGADO 


El punto “cero” días muestra la tasa después de veinticuatro horas de acceso con- 

tinuo a la comida. La tasa sube rápidamente durante las primeras veinticuatro 

horas y sigue de una forma más o menos lineal hasta alcanzar su punto culminante 
al día quinto. Experimentos realizados en colaboración con W. T. Heron 


La figura 142 constituye un gráfico que muestra el número medio 
diario de respuestas. Como hay diferencias individuales en lo que se re- 
fiere al día en que se alcanza la tasa máxima, la interpretación resulta 
un tanto difícil. La rata que primero alcanzó su tasa máxima lo hizo al 
cuarto día, mientras que en el otro extremo una rata prolongó su ascen- 
sión hasta el día decimotercero después del inicio del periodo de ayuno. 
Si dejamos de lado esta dificultad y suponemos que hay una relación 
directa entre la tasa de respuesta y la fuerza del impulso, el impulso 
máximo medio del grupo se situó en el quinto día después del inicio del 
periodo de ayuno. 

La figura 142, asimismo, indica que la relación entre el aumento del 
impulso medio y el progreso de la inanición es aproximadamente lineal 
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hasta que se alcanza el punto culminante. La mayor desviación de la 
forma lineal es la subida relativamente brusca entre el primero y el se- 
gundo punto de la curva, pero esto no es más que un artificio debido 
al hecho de que el primer período fue precedido por un espacio de 
24 horas de acceso continuo a la comida. La curva de la figura 142 sólo 
se ha representado hasta el sexto día después del inicio del ayuno. Unos 
cuantos animales siguieron con el experimento después de este punto, 
pero bastantes murieron antes de que se pudiera tomar el séptimo regis- 
tro. Hubiera sido engañoso continuar la curva, pues ya no habría sido 
representativa de la totalidad del grupo. 


PUNTO CULMINANTE 
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TIEMPO PARA ALCANZAR EL PUNTO CULMINANTE 


Ficura 143 2 


CAMBIO DE LA TASA MEDIA Y PÉRDIDA DE PESO CUANDO SE SUPERPONEN LOS REGISTROS 
INDIVIDUALES DE TAL FORMA QUE COINCIDAN LOS PUNTOS CULMINANTES 


Las líneas continuas representan la tasa; las líneas de trazos la pérdida absoluta 

de peso. El grupo A muestra un descenso más rápido después del punto culminante 

que el grupo B. Las líneas horizontales marcadas con una x indican la tasa en 

vigor bajo el programa normal de alimentación. Experimentos realizados en colabo- 
ración con W. T. Heron 


A. causa de las diferencias individuales con respecto al tiempo en que 
se alcanzó el punto culminante, se creyó deseable superponer los registros 
individuales en sus tasas máximas. Esto se hizo de la forma siguiente : 
Se indicaron en una hoja de papel gráfico el punto de inicio del experi- 
mento y el punto culminante. La distancia entre ellos se dividió en un 
número igual de partes correspondientes al número de días necesarios 
por una rata para alcanzar su punto culminante. Los datos de esta rata 
se representaron gráficamente y se conectaron los puntos por medio de 
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líneas rectas. Se sometieron al mismo tratamiento los datos de cada rata. 
Entonces se trazaron ordenadas para dividir cada una de las curvas in- 
dividuales en ocho partes iguales. Se tomaron las interacciones de las or- 
denadas con las curvas individuales en cada vertical y se promediaron 
estos datos. Las curvas de la figura 143 (líneas continuas) corresponden 
a los promedios así obtenidos. Las partes de las curvas situadas más allá 
de los puntos culminantes se espaciaron sobre las coordenadas asignadas 
a cada rata y se obtuvieron promedios de la misma forma. Como hubo 
cierta variación individual en el espacio de tiempo que transcurrió entre 
el momento en que se alcanzó el punto culminante y el momento de la 
muerte, las secciones de las curvas situadas a la derecha de los puntos 
culminantes no son representativas de la totalidad del grupo a lo largo 
de su duración completa. 


Antes de establecer las curvas de grupo, se representaron los registros 
diarios de cada rata. Una inspección de las curvas individuales indicó 
que sería conveniente dividirlas en dos grupos. El primer grupo (gru- 
po A de la figura 148) se compone de ocho animales que subieron a sus 
tasas máximas y luego descendieron precipitadamente hacia cero. El se- 
gundo grupo se compone de los cinco restantes animales, cuya curva 
viene mostrada en el recuadro B de la figura 143. Mantuvieron una tasa 
media más baja durante los primeros 6/8 del tiempo. A partir de este 
momento su tasa aumentó más rápidamente hasta que alcanzaron el 
punto culminante, que no fue tan alto como el alcanzado por el primer 
grupo. Después de dicho punto su tasa no declina tan rápidamente y su 
tiempo medio de supervivencia es mayor. 


No está claro que las diferencias de estas dos curvas indiquen una 
diferencia fundamental en los animales. La diferencia después del punto 
culminante puede ser un artificio causado por el hecho de que el pro- 
ceso continuo se muestreó a intervalos relativamente extensos de veinti- 
cuatro horas. Por ejemplo, en las ratas representadas en la curva B el 
impulso pudo haber alcanzado su punto culminante en el intervalo de 
24 horas que transcurrió entre el período experimental que mostró la 
tasa más elevada y el próximo período experimental. En otras palabras, 
el punto culminante mostrado en la curva posiblemente queda desplaza- 
do hacia la izquierda de su verdadera posición. Esta dificultad es inhe- 
rente a la presente técnica, pero podría minimizarse usando períodos ex- 
perimentales más cortos, espaciados con intervalos más próximos. 


Después que cada animal ha superado su punto culminante, es obvio 
que se halla en un estado extremadamente débil. Aunque no se tomaron 
las temperaturas, su cuerpo se notaba frío al tacto, su pelo estaba erizado 
y desordenado y en muchos casos no podía mantener una postura normal. 
De estas observaciones y de la temprana muerte del animal después de 
alcanzar su punto culminante, podemos concluir que el descenso de tasa 
fue debido más a su debilidad física que a un descenso independiente 
del estado del impulso. Los experimentos no confirman la observación, 
en el caso del hombre, de un rápido descenso del hambre durante perío- 
dos de prolongado ayuno. 

Las dos líneas trazadas paralelas a la línea-base y marcadas con 
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una X de la figura 143 indican la tasa de respuesta bajo el método de 
alimentación usual, determinado para los grupos respectivos antes del 
inicio del período de ayuno. Es evidente que el nivel de impulso mante- 
nido por el método de alimentación usual está muy por debajo del má- 
ximo. 


Las curvas de trazos de la figura 148 representan la pérdida absoluta 


RESPUESTAS 


TIEMPO EN MINUTOS 
Ficura 144 2 


CONJUNTO DE REGISTROS DE UNA RATA DEL GRUPO Á DE LA FIGURA 143 


El registro A fue tomado después de veinticuatro horas de acceso continuo a la 
comida. Los registros B, C... fueron tomados a intervalos de veinticuatro horas. 
La ligera aceleración durante la hora en los registros E y F no es típica 


de peso de los dos grupos. Se pesó diariamente cada rata después de 
cada período experimental y se calculó la pérdida de peso. Los datos 
así obtenidos se representaron gráficamente de la misma forma que las 
tasas de respuesta, siendo marcado el punto final de la curva de peso 
de cada rata por el día en que alcanzó su tasa máxima de respuesta. 
Un examen de la figura 143 muestra que la correspondencia entre la 
pérdida de peso media y la tasa de respuesta media es muy estrecha. 


La figura 144 muestra el tipo de registro obtenido en días sucesivos. 
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Para dar cabida a las altas tasas obtenidas en este experimento, se re- 
dujo cuatro veces la escala de las ordenadas. La curva Á corresponde al 
registro efectuado después de 24 horas de continuo acceso a la comida. 
Como la rata estaba casi saciada, su tasa fue muy baja. El registro B se 
tomó un día después del inicio del ayuno y corresponde aproximadamente 
a la tasa mantenida bajo el método de alimentación usual. Los registros 
restantes corresponden a los días sucesivos de ayuno hasta que la rata 
alcanzó su punto culminante al quinto día (curva F). Esta rata pertenecía 
al primer grupo y no sobrevivió para poder seguir con el experimento, al 
día siguiente del punto culminante. 


Estos experimentos sobre ayuno prolongado, junto con los experi- 
mentos anteriores sobre los grados subnormales de hambre, aparente- 
mente, abarcan toda la gama de grados disponibles. La conducta de 
la rata es congruente con el supuesto de que el efecto primario del ham- 
bre repercute sobre la tasa de respuesta. No hemos podido revelar 
ningún otro cambio en la conducta. Los registros diarios son aproximada- 
mente lineales y las variaciones momentáneas (las pequeñas irregulari- 
dades o “textura” de los registros), aparentemente, permanecen inal- 
teradas. Así, pues, podemos generalizar aún más la relación estudiada 
en el capítulo anterior. El efecto del impulso sobre la tasa es el mismo 
no sólo cuando se refuerzan todas las respuestas (como en la curva de 
ingestión normal) o cuando no se refuerzan (como en la extinción), sino 
también cuando se mantiene una tasa constante mediante reforzamiento 
periódico. 

Si el cambio de tasa es el único efecto del cambio de impulso, po- 
demos deducir tres inferencias. 1) La tasa de respuesta durante una 
hora a un impulso bajo, debiera incrementar la reserva, ya que las res- 
puestas se refuerzan con la misma frecuencia que con el impulso nor- 
mal, pero la reserva no se ve drenada a la misma tasa. 2) Inversamen- 
te, la respuesta durante una hora a una tasa más alta debiera drenar 
la reserva, pues ya no se refuerzan más respuestas que a la tasa nor- 
mal, mientras que se producen muchas más respuestas, 3) El impulso 
normal obtenido por la alimentación diaria por un período limitado 
debe considerarse el impulso que se precisa para obtener felizmente 
un equilibrio entre el input y el output. La tercera inferencia no es 
probable que se mantenga, pues el procedimiento de control del im- 
pulso es completamente arbitrario. La primera y la segunda inferencias 
son erróneas a todas luces. 


Una tensión sobre la reserva o una contribución a la misma debie- 
ran aparecer como una curvatura en el registro, después de hacer un 
cambio de una tasa baja a una alta, o viceversa. Pero no es así. Nece- 
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sitamos saber primero si se produce una curvatura como resultado de 
pasar de una tasa superior a una inferior. Se agruparon las mediciones 
de todos los registros de los experimentos anteriores sobre impulso sub- 
normal a un impulso inferior que el del día precedente, y las curvatu- 
ras medias, expresadas como hasta ahora, resultaron ser de las siguien- 
tes direcciones y magnitudes: Grupo A: +1.1%; grupo B: —3.2.%; 
grupo C: —6.0%, El promedio es — 2.7%. Aunque la curvatura sigue 
la dirección correcta para indicar cierto drenaje de la reserva en la 
tasa superior precedente, el valor es, probablemente, insignificante. En 
el caso de los registros con impulsos superiores a los del día ante- 
rior el resultado es similar. Cuando se agrupan, las curvaturas resultantes 
son las siguientes: Grupo A: + 4.1%; grupo B: +0.6%; grupo C: 
+ 2.2%. El promedio es + 2.3%. Una vez más hay cierto signo de que 
la reserva se ha visto favorecida con los reforzamientos a un impulso 
bajo, pero el valor es apenas significativo. 

En el caso de los grupos B y C del experimento sobre impulsos sub- 
normales se aparearon los días en un intento de revelar el efecto del 
reforzamiento periódico sobre la reserva. Los promedios de todos los 
pares de días que siguieron a una pendiente más baja son de 183 y 153, 
para el primero y el segundo días, respectivamente. Esto confirma la 
tendencia ya indicada. El primer día con el impulso más elevado, es 
especialmente alto, porque la reserva se ha aprovechado del reforza- 
miento a una tasa de gasto más baja. Pero los promedios de todos los 
pares siguientes a una pendiente más alta son de 107 y 102, lo cual 
muestra una tendencia en la misma dirección y contradice la evidencia 
anterior. Cabe esperar cierto desplazamiento en esta dirección debido 
al descenso espontáneo de la tasa durante el recondicionamiento pe- 
riódico descrito en el capítulo 4. Un resultado incongruente semejante 
se obtiene a partir del grupo A promediando todos los valores de cual- 
quier impulso en grupos, de acuerdo con el impulso anterior. No todos 
estos grupos son representados, pues los cambios fortuitos de impulso 
no están bien distribuidos; pero de los datos se pueden obtener las de- 
terminaciones siguientes (y no otras): a) (contradictoria) los valores de 
todos los registros de cero gramos después de un día de seis gramos 
son superiores en un 11% a los de cero gramos después de un día de 
cuatro gramos; los valores de cuatro gramos después de un día de seis 
gramos son superiores en un 11% a los de cuatro gramos después de 
un día de dos gramos cada uno; b) (confirmatoria) el valor medio de to- 
dos los registros de dos gramos después de días de cero gramos son 
Superiores en un 11 % a los siguientes a un día de cuatro gramos; y los 
valores de seis gramos siguientes a cero gramos son en un 12% supe- 
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riores a los siguientes a cuatro gramos. Estas irregularidades, proba- 
blemente, se deben al muestreo; y para el presente grado de aproxima- 
ción al menos, podemos concluir que no se experimenta efecto alguno 
sobre la reserva. 


El hecho adicional aportado por estos experimentos es que el efec- 
to recondicionante de un solo reforzamiento está en función del im- 
pulso. (Cabe recordar que el efecto de extinción debido a una interrup- 
ción del refuerzo, probablemente no lo está.) El cambio de tasa de 
respuesta con un cambio de impulso corresponde a la razón de extin- 
ción. Sólo partiendo de este supuesto podemos explicar el mantenimiento 
de tasas muy altas durante el ayuno prolongado, pues no existe nin- 
guna reserva de un tamaño tal que sea capaz de mantener a una rata 
durante el período de ayuno a aquella tasa, sin contribuciones adicio- 
nales de un reforzamiento más efectivo. 


no” 


La medición y comparación de impulsos 


La cuestión de cómo debemos medir la fuerza del impulso se re- 
suelve prácticamente en el momento en que nos decidimos por una 
definición. Debemos medir, no el impulso como tal, sino conducta. Esta 
formulación no identifica conducta e impulso. Ya hemos mostrado 
que el impulso debe considerarse más exactamente como un estado de 
proporcionalidad entre la reserva y la fuerza momentánea. Pero si no 
ocurren cambios en el tamaño de la reserva y si las otras variables se 
mantienen constantes, la fuerza de un impulso es proporcional a la fuer- 
za de cualquier otro reflejo asociado con él. De ahí que cualquier téc- 
nica para medir el impulso sea una técnica para medir la fuerza del 
reflejo. Constituye un pobre sustituto medir la operación responsable 
del estado de un impulso, hasta que se conozca con precisión la relación 
entre el estado y la operación. Un “hambre de veinticuatro horas” es 
quizás un grado de hambre relativamente constante, pero las “vein- 
ticuatro horas” no constituyen una representación conveniente del va- 
lor, pues el hambre no varía de forma completamente lineal con el 
tiempo del ayuno. 

Una forma bien conocida de estimar la fuerza de la conducta como 
función de un impulso-operación, consiste en observar la preponderan- 
cia relativa de la conducta sobre una conducta incompatible que se 
supone tener una fuerza relativamente constante. En el “método de 
obstrucción” de Columbia (74) se opone una respuesta de escape a 
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una rejilla eléctrica, a una respuesta hacia la rejilla, condicionada a base 
de colocar comida, o algún otro estímulo reforzante. La fuerza de la 
respuesta hacia la rejilla se estima contando el número de ocasiones 
en que el acercamiento predomina sobre la respuesta de alejamiento 
de la misma durante un período determinado. Pueden hacerse varias 
objeciones a este método: 1) La respuesta de alejamiento de la rejilla se 
ve afectada por las variaciones de la intensidad del shock (que son di- 
fíciles de evitar), por el desarrollo de métodos de desplazamiento que 
reducen la intensidad, por la adaptación al shock, etc. 2) El condicio- 
namiento de la respuesta hacia la rejilla puede no empezar o permane- 
cer máximo. 3) El conflicto de las respuestas y el mismo shock pueden 
ser variables adicionales (emocionales) que modifiquen la fuerza du- 
rante el experimento. : 

El uso de un reflejo normal con el cual puedan compararse los 
otros reflejos es innecesario. Los mismos métodos de medición de fuer- 
za son posibles en el estudio del impulso como en cualquier otro cam- 
po en que varíe la fuerza. A pesar de ello, se puede argitir que el mé- 
todo de obstrucción aventaja la medición directa de la conducta 
proporcionando un medio de comparación de diferentes impulsos. Los 
impulsos A y B guardan una relación recíproca determinada por la 
preponderancia relativa de los reflejos típica de cada uno de ellos cuan- 
do se oponen al mismo reflejo normal. Sin embargo, el tercer término 
del reflejo normal es innecesario. La forma más simple de determinar 
si el hambre es más fuerte que el sexo es colocar estímulos apropia- 
dos para cada impulso delante del organismo al mismo tiempo. Si se 
sostiene que los impulsos se influencian mutuamente, de manera que 
los grados máximos de los dos impulsos no pueden existir al mismo 
tiempo, la cuestión de la comparación es académica y puede pasar- 
se por alto. 


Cualquier método de medición del impulso se ve afectado por el 
hecho de que si se toma más de una medición, o bien el impulso debe 
modificarse por un reflejo consumatorio después de la primera medi- 
ción, o bien el grado de condicionamiento debe afectarse por la retirada 
del estímulo reforzante. El sexo es particularmente difícil de medir por 
esta razón. Incluso en el caso del hambre, en que una respuesta con- 
sumatoria puede tener un efecto muy ligero, tiene que ocurrir algún 
debilitamiento de la fuerza. A causa de las diferentes soluciones a este 
problema, las curvas del cambio de hambre durante el ayuno prolonga- 
do dadas arriba (figuras 142 y 148) difieren significativamente de las 
obtenidas con la técnica de obstrucción. Con objeto de evitar el efecto 
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de los reflejos consumatorios, Warden y Warner (74) usaron grupos de 
ratas para cada período de ayuno y tomaron sólo una medición para 
cada individuo. En el experimento descrito antes se proporcionó cierto 
reforzamiento con comida cada día y, aunque esto retrasó la muerte 
por inanición hasta cierto punto, fue posible seguir a cada individuo 
a lo largo del proceso. Cuando se promedian las curvas individuales, la 
curva resultante se parece mucho a la de Warden y Warner, excepto 
en que el punto culminante aparece un poco después. Pero esta curva 
media difiere, bajo dos importantes aspectos, del caso individual: en 
la curva individual, el aumento de hambre es más lento, la caída final 
más brusca y la altura del punto culminante, mayor. Estos resultados 
se deben al hecho de que diferentes ratas alcanzaron puntos culminan- 
tes en momentos diferentes. Si esto también hubiera ocurrido, como es 
probable, en los experimentos de Columbia, la curva allí obtenida no 
representa correctamente el curso del cambio de hambre o el valor 
máximo alcanzado. Algunas de las ratas que ayunaron durante cuatro 
días habían alcanzado, probablemente, su impulso máximo antes del 
período experimental y ciertamente algunas lo alcanzaron después. 
Fue en el cuarto día cuando más ratas alcanzaron su impulso máximo 
o casi máximo a diferencia de cualquier otro período usado. En el ex- 
perimento presente las ratas llegaron a sus puntos culminantes entre 
el cuarto y el decimotercer día de ayuno. La media es de 7.3 días y 
la mediana de 7. Promediando las tasas de todas las ratas se obtiene 
el punto culminante a los cinco días. La comparación de la altura del 
punto culminante de la figura 142 con las alturas de la figura 143 mos- 
trará el efecto deprimente que la promediación del grupo tiene sobre 
el valor máximo, prescindiendo de las curvas individuales. 

Esta dificultad no sería seria si las mediciones de todos los impulsos 
se vieran afectadas de la misma forma, pero desgraciadamente, no su- 
cede así. Hay ciertas condiciones bajo las cuales el efecto deprimente 
se ve minimizado. 1) Si el impulso sube muy rápidamente hasta un 
punto culminante (cf. sed), el método de promediación de los grupos 
afectará a muchos más animales cerca de su punto culminante que si 
el impulso subiera lentamente como en el caso del hambre. 2) Si se 
mantiene el impulso en el punto culminante por un período relativa- 
mente largo, las posibilidades de hallar a todos los animales en su pun- 
to culminante, o cerca del mismo, son muy buenas. Un ejemplo de ello 
es el impulso maternal, que probablemente se mantiene a su nivel má- 
ximo durante bastantes días mientras una camada es joven. Puede ser 
que el impulso del hambre sea en realidad más débil que el impulso 
de la sed; si esto es así, este método ha exagerado la diferencia. O 


418 


puede ser que el impulso del hambre sea, en realidad, más fuerte que 
el impulso de la sed, pero como la media del hambre se ha deprimido, 
aparece más débil. Si queremos comparar la fuerza de los impulsos má- 
ximos, la comparación debiera basarse en el punto culminante indivi- 
dual medio. 

Es dudoso si el uso de grupos de ratas constituye un medio satis- 
factorio para evitar el ligero cambio de impulso que se produce cuando 
se efectúan repetidas mediciones sobre individuos. 
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11. Otras variables que afectan 
la fuerza del reflejo 


La emoción 


El tipo importante de cambio en la fuerza del reflejo que nos queda 
por examinar, comúnmente observado en la conducta normal puede 
denominarse, a pesar de ciertas definiciones en boga, “emocional”. Qui- 
zás la concepción más corriente de la emoción es que es una forma 
de respuesta. Aun cuando se diga que el dato primario es una “expe- 
riencia”, generalmente se recurre a cierta forma de respuesta, ya sea 
como expresión de la emoción o ya sea como antecedente o actividad 
concomitante. Es tentador aceptar esta formulación bien establecida, 
ya que podría incorporarse al presente sistema sin mayores problemas. 
Si un niño llora cuando se lastima y si llorar es la emoción (o al menos 
el único dato de la conducta a tomar en cuenta), podemos establecer 
una correlación entre el estímulo lesivo y el flujo de lágrimas exacta- 
mente como en el caso de cualquier otro reflejo. Pero esta disposición 
de la conducta emotiva no deja de presentar dificultades. ¿Por qué 
parte de las reacciones de un organismo deben constituir una clase 
especial? ¿por qué debemos clasificar el lloriqueo en respuesta a una 
contusión en la espinilla como emocional y en cambio el lloriqueo en 
respuesta a una mota en el ojo como no emocional? Muchas personas 
dividen fácil y consistentemente muchas de las respuestas de un orga- 
nismo en esos grupos, pero ¿con qué justificación? 

A mi juicio, no se ha propuesto ningún criterio satisfactorio en res- 
puesta a estas cuestiones. La definición de una emoción como una 
respuesta en la que participan ciertos efectores —principalmente los 
que se hallan bajo el control del sistema nervioso autónomo— no es 
en modo alguno rigurosa, ya que, probablemente, no hay efectores in- 
volucrados en la emoción que no participen también en la conducta 
no-emocional. El criterio de una característica identificable de la ex- 
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periencia sólo es asequible indirectamente en un estudio de la conducta, 
y, probablemente, se ve reducido a estimulación propioceptiva o inte- 
roceptiva identificable, pero las respuestas que proporcionan una forma 
única de estimulación también deberían proporcionar una clasificación 
topográfica, de manera que el criterio anterior se viera implicado. Un 
tercer criterio lo constituye el carácter difuso de la reacción emocional, 
un cuarto es su desorganización o ineficacia, etc. 

Las tentativas de definición de la emoción como una forma especial 
de respuesta no nos interesan aquí, pues en este momento necesitamos 
una concepción completamente diferente. Según la presente formula- 
ción, la emoción no es, primariamente, una forma de respuesta en abso- 
luto, sino más bien un estado de fuerza comparable, bajo muchos as- 
pectos, al impulso. En la medida en que ocurra una respuesta a un 
estímulo emocional, tiene que estudiarse como cualquier otra respues- 
ta, pero la respuesta no define al estímulo como emocional y sólo cons- 
tituye el acompañamiento del cambio emocional central. Los cambios 
de fuerza inducidos por el mismo estímulo proporcionan criterios prác- 
ticos, y constituyen los datos más corrientes en este tipo de problemas. 
Sé que un hombre está enojado, no porque segregue adrelina o porque 
Su presión sanguínea aumente, sino porque me saluda hoscamente, me 
estrecha la mano lentamente y sin energía, responde a mis observacio- 
nes secamente y me evita si puede. Todas las respuestas que está acos- 
tumbrado a hacer en mi presencia han sufrido un cambio significativo, y 
ese cambio constituye el dato primario sobre el que baso la afirmación 
de que está enojado. Asimismo, sé que un compañero tiene miedo en 
un camino solitario y oscuro, no porque vea que las palmas de sus ma- 
nos están sudando o su pulso se ha acelerado, sino porque se sobresalta 
con facilidad, habla en susurros, si es que habla, mira constantemente 
a su alrededor, etc. Es cierto que con un examen más atento, en ambos 
casos puedo descubrir respuestas (en lugar de cambios en la fuerza 
de los reflejos) que hasta cierto punto son características, aunque no 
peculiares, de cada estado. Si hemos de llamar emocionales a estas res- 
puestas, no es porque posean ningún carácter esencialmente emocional, 
sino porque son provocadas por estímulos que típicamente inducen cam- 
bios en la fuerza del reflejo. 

El simple experimento realizado por Bousfield y Sherif (33) consti- 
tuye un buen ejemplo de este aspecto de la emoción. Estos investiga- 
dores registraron el efecto de un Sonido agudo sobre el ritmo al que 
comen las gallinas y los conejillos de Indias. Se administró comida a 
estos animales hambrientos y, poco después de que empezaran a co- 
mer, se realizó un disparo. Se midió en cada caso el tiempo que trans- 
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currió antes de que el animal volviera a comer. Una propiedad del 
efecto mostrada por Bousfield y Sherif fue su adaptación relativamente 
rápida. En esos experimentos también se pudo haber mostrado que el 
disparo producía, al menos, otros dos tipos de efectos: 1) una respues- 
ta de sobresalto con afectación de la musculatura esquelética; 2) res- 
puestas autónomas con alteración de la presión sanguínea, de la velo- 
cidad del pulso, etc. No se ha podido mostrar que ninguno de estos 
cambios fuera típico de la emoción. El cambio en el estado de la con- 
ducta ingestiva, por otra parte, requiere una clasificación separada del 
disparo como estímulo. En lo que aquí respecta, este cambio de fuerza 
no es sólo la característica definitoria de la emoción, sino el único 
efecto que precisa de un tratamiento especial. 

Por supuesto, esta concepción de la emoción no es nueva. Muchas 
teorías se han basado en cambios de la conducta normal en vez de fun- 
damentarse en la producción de respuestas específicas, y muchas de 
ellas son compatibles con la presente definición. El proceso central 
de la emoción ha sido eludido, en gran parte, por muchas investigacio- 
nes porque éstas se llevan a cabo para buscar correlaciones de la expe- 
riencia o de expresiones específicas. Al catalogar los fenómenos de la 
emoción, uno se siente naturalmente tentado a fijarse en manifestacio- 
nes que son comunes a la mayoría de los organismos. Los cambios de 
fuerza carecen de esta generalidad porque dependen, en gran parte, 
de los repertorios individuales. Pero aunque esto hace que la identifi- 
cación y la clasificación de los efectos emocionales sea difícil, no de- 
bería ocasionar una mala interpretación de la característica central. 

El problema, bajo muchos aspectos, es similar al del impulso. Las 
respuestas específicas en la emoción se parecen mucho a los estímulos 
específicos en los impulsos. Así como la hipótesis de una estimulación 
aferente particular no puede prescindir del estudio de todos los cam- 
bios conductuales debidos a un cambio en el impulso, el recurso a res- 
puestas específicas no proporciona un substituto fácil al análisis de to- 
dos los cambios posibles en la fuerza del reflejo consiguientes a la 
presentación de un estímulo emocional. En ambos casos, debemos descri- 
bir en la covariación de las fuerzas una serie de reflejos como funciones 
de una operación particular. El impulso y la emoción son campos se- 
parados sólo porque las operaciones apropiadas pueden separarse en 
clases diferentes. En muchos casos esta distinción es endeble. Se dice 
que una rata hembra cuida a sus crías porque posee un impulso mater- 
nal; cuando la misma rata mata a sus crías para comérselas, se dice 
que actúa con arreglo a otro impulso; pero, cuando tras ser trasladada 
a un nuevo lugar perturbador, mata a sus crías y no se las come, se dice 
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que actúa emocionalmente. Se hace la distinción sólo porque la ope- 
ración responsable de matar difiere de la operación de comer o del 
impulso maternal. El efecto sobre la conducta es del mismo tipo en 
ambos casos. 

No es esencial a esta formulación que el impulso y la emoción cons- 
tituyan dos clases distintas. Lo importante es el reconocimiento de un 
campio de fuerza como dato primario y la determinación de la relación 
funcional entre la fuerza y cierta operación. Podemos prescindir de los 
términos impulso y emoción siempre que pierdan su utilidad. En efec- 
to, me parece que una de las virtudes de esta concepción de la emoción 
es que se asemeja tanto a la del impulso. Una emoción es un proceso 
dinámico en lugar de una relación estática entre estímulo y respuesta. 

Hemos utilizado el término emocional en los capítulos anteriores 
de acuerdo con esta definición. Hemos relacionado un estado de fuer- 
za reducida, más o menos temporal (un aumento de fuerza también ca- 
bría en la misma formulación), con un estímulo perturbador o con al- 
guna otra operación emocional, como la interrupción de un reforza- 
miento. En varios casos hemos observado la propiedad de una rápida 
adaptación. Sin embargo, no dispongo de experimentos especiales que 
citar en este sentido, y cae fuera de los límites del libro intentar una 
clasificación topográfica de los diversos tipos de operaciones emocio- 
nales o de los reflejos que varían conjuntamente con las diferentes 
emociones. Podemos advertir que uno de los problemas de la clasifica- 
ción, que parece tan insoluble en términos de respuestas emocionales, 
resulta ser mucho menos difícil en términos de variaciones en la fuerza 
del reflejo. La ira y el temor implican, claramente, diferentes estados 
de fuerza en diferentes reflejos, por semejantes que puedan ser las 
respuestas de las glándulas y de los músculos lisos. Las emociones leves, 
cuyas respuestas correspondientes son difíciles de aislar, no se ven menos 
favorecidas; aunque las variaciones pueden ser menos intensas, las dis- 
tinciones son topográficas y se hacen fácilmente en la medida en que 
los cambios son completamente observables. 


Las drogas 


Los efectos de las drogas sobre la fuerza del reflejo se han estudia- 
do de forma bastante intensa en el caso de los reflejos posturales y 
espinales (cf., por ejemplo, Magnus [61]), pero en lo que se refiere a 
la conducta de la totalidad del organismo, disponemos de menor in- 
formación. Gran parte de la información disponible ha sido recogida 
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y descrita por farmacólogos utilizando un lenguaje vulgar y, debido a 
la dificultad de hablar sobre la conducta en términos cuantitativos, los 
efectos descritos a menudo se limitan a sistemas neurales relativamente 
aislados que se prestan a una descripción simple. Por ello, es difícil 
decir, en la actualidad, hasta qué punto las drogas afectan a la estruc- 
tura o a la dinámica de la totalidad de la conducta. Parece que los 
diversos sistemas reflejos se ven afectados diferencialmente, siguiendo 
líneas de demarcación que, a veces, se aproximan a las dadas por los 
diversos impulsos y emociones, y que una droga puede afectar la rela- 
ción topográfica entre el estímulo y la respuesta. Pero no está claro 
si los efectos inciden sobre la reserva o sobre la relación entre la re- 
serva y la fuerza inmediata. 

Como en el caso de la emoción, dispongo de muy poco material que 
citar. Sin embargo, podemos considerar algunos de los experimentos 
sobre los efectos de la cafeína y de la benzedrina efectuados en cola- 
boración con el profesor Heron, usando la presente técnica como ejem- 
plo del tipo de análisis que se precisa para que esta cuestión encaje en 
un sistema de conducta. La cafeína o benzedrina fue administrada por 
inyección subcutánea en una solución salina fisiológica de 0,5 cc. En 
los días de control se inyectó al animal una cantidad igual de solución 
salina. En todos los casos, la droga se administró al animal inmediata- 
mente antes de ponerlo en el aparato y de que empezara el experimen- 
to. Cito, con ligeros cambios, el informe de esos experimentos (23). 


La figura 145 consiste en un gráfico que muestra el número diario y 
medio de respuestas por hora de cuatro ratas que recibieron 10 mg. de 
sodiobenzoato de cafeína en los días indicados. Las ratas habían sufrido 
varias semanas de recondicionamiento periódico a intervalos de cuatro 
minutos antes de administrárseles la cafeína. Sin excepción, la cafeína 
aumentó la tasa de respuesta media, aunque, en varias ocasiones, una rata 
individual no mostró incremento alguno. (Al cuarto día, el aumento de 
la tasa media no era muy grande. La solución de cafeína tenía varios días 
y se creyó que podría haberse deteriorado. En el último día se usó una 
nueva solución y la tasa media volvió a su anterior posición. Por su- 
puesto, este único caso no puede ser decisivo para determinar si la solu- 
ción se había deteriorado realmente o no.) 

Tras haber administrado la cafeína dos veces, se nos ocurrió que el 
aumento de la tasa podría haber sido causado indirectamente por un 
incremento del hambre (ver capítulo 10). Para comprobar esta posibili- 
dad se determinó, a partir del peso, la cantidad de comida ingerida por 
cada rata después de cada día de experimentación. En la parte superior 
de la figura 145 representamos gráficamente el consumo medio de co- 
mida y podemos ver que existe una estrecha correspondencia entre las 
variaciones en la cantidad de comida consumida, y la tasa de respuesta 
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de ese día. Es evidente que la cafeína aumenta el consumo de comida y 
que, al parecer, la rata está más hambrienta cuando se halla en el apa- 
rato. Esto explicaría parte del efecto sobre la conducta, pero, probable- 
mente, no todo (ver más adelante). 

Como la cafeína se administra inmediatamente antes del experimento, 
se podía suponer que la curva acumulativa se aceleraría positivamente, 
ya que la droga necesita cierto tiempo para actuar, La figura 146 (pági- 
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C = 10.mg. de SUDIO-BENZOATO DE CAFEINA 


RESPUESTAS POR HORAS 


DÍAS 
Ficura 145 % 


EFECTO DE LA CAFEÍNA SOBRE LA TASA BAJO REFORZAMIENTO PERIÓDICO Y SOBRE 
EL CONSUMO DE COMIDA 


Las curvas inferiores dan las tasas individuales (líneas más finas) y las medias 

(líneas más gruesas). La curva superior muestra el consumo medio de comida. La 

cafeina se administró antes del experimento, tal como viene indicado. Experimentos. 
realizados en colaboración con el profesor W. T. Heron 


na 426) da la curva media acumulativa correspondiente al primer día. La 
curva no se acelera de forma significativa y, por tanto, la acción de la 
droga debe empezar inmediatamente. La curva media del día de con- 
trol anterior también viene indicada. 

En la figura 147 B mostramos la curva de extinción de las cuatro 
ratas de la figura 145. Al quinto día se administró la cafeína y la tasa 
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se restableció casi hasta el nivel alcanzado bajo reforzamiento periódi- 
co. Hacia el segundo día después de la administración de la cafeína, se 
produce otra subida en la curva de extinción como una especie de rebo- 
te. Ambos incrementos van acompañados por aumentos correspondientes 
en el consumo de comida, tal como viene indicado en la curva A de 
la figura 147. 


CAFEINA 


RESPUESTAS 


MINUTOS 
Ficura 146 % 


TASA DURANTE UNA HORA BAJO LOS EFECTOS DE LA CAFEÍNA Y BAJO LOS EFECTOS 
DE UNA INYECCIÓN DE CONTROL DE SOLUCIÓN SALINA 


El efecto de la cafeína se hace sentir inmediatamente 


La curva C de la figura 147 muestra una repetición del experimento 
con un grupo de ocho ratas que también había tenido una experiencia 
considerable en la situación experimental antes de empezar la extinción, 
y que dio una tasa constante mucho más alta durante el recondicionamien- 
to periódico. En este caso, la cafeína hizo volver otra vez la tasa casi 
a su nivel original, y, al segundo día después de administrar la cafeína, 
se produjo asimismo un «rebote». Desgraciada e irremisiblemente no se 
midió el consumo de comida en este grupo. 

La única explicación que podemos dar de la subida secundaria es 
que la rata come desmesuradamente el día de la administración de la 
cafeína y, por consiguiente, al día siguiente ingiere una ración inferior 
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a la normal. Así, pues, al tercer día está más hambrienta que de cos- 
tumbre. Sin embargo, el mismo fenómeno no parece ocurrir bajo las 
condiciones del reforzamiento periódico (ver figura 145). La tasa del 
segundo día, después de la administración de la cafeína, no es, en este 
caso, más alta, como cabría esperar, y la curva de consumo de comida 
tampoco presenta el rebote esperado. 

El intento de explicar los efectos de la cafeína en términos del ham- 
bre se ve debilitado por los resultados de la administración de la benze- 
drina. Los animales del segundo grupo que acabamos de mencionar, 
recibieron 0,5 mg. de sulfato de benzedrina (una dosis relativamente 
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EFECTOS DE LA CAFEÍNA Y DE LA BENZEDRINA SOBRE LA TASA DURANTE LA EXTINCIÓN 


La curva A muestra el consumo medio de comida de las cuatro ratas de la curva B. 

La curva C muestra el resultado con un grupo de ocho ratas. Nótese el “rebote” 

del segundo día después de la administración de la cafeína. Experimentos realizados 
con la colaboración de W. T. Heron 
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grande si tenemos en cuenta la tolerancia humana) al undécimo día de 
extinción. La curva C de la figura 147 muestra que la droga produjo una 
completa restauración de la tasa de respuesta al nivel del reforzamiento 
periódico. Pero la tasa no vuelve al nivel de extinción previo, al día si- 
guiente. La razón de ello, aungue puede ser significativa, no está clara, 
ya que al parecer la droga es eliminada enteramente en el curso de unas 
pocas horas. Los resultados obtenidos con la benzedrina no están en con- 
sonancia con la idea de que los cambios de hambre explican los efectos 


de la cafeína, ya que la benzedrina hace disminuir el hambre, como 
ha mostrado Wentink (78). 


Con un experimento en el que se eliminó la influencia del hambre 
hemos obtenido información complementaria sobre el efecto de la ben- 
zedrina y su relación con el mismo. Se administraron inyecciones de 
benzedrina a cuatro ratas en estado avanzado de extinción, aproxima- 
damente media hora después del inicio de un período experimental. En 
la figura 148 mostramos dos registros típicos (Ai y A»). Cada curva em- 
pieza con la tasa usual en ese estadio de extinción. En las señales ver- 
ticales se administró una dosis de 0,5 mg. de sulfato de benzedrina, con 
el efecto usual de una subida de la tasa casi inmediata. Los registros 
se tomaron durante unas dos horas, durante las cuales el efecto de la 
benzedrina disminuyó sólo ligeramente. Inmediatamente después de 
este experimento las ratas recibieron un generoso suministro de comi- 
da, que permaneció en sus jaulas hasta el día siguiente. También se 
colocó comida adicional en las cajas experimentales, junto con un su- 
ministro de gránulos en cada comedero. Al iniciarse la sesión experi- 
mental siguiente, por tanto, cada rata no sólo había tenido acceso con- 
tinuo a la comida durante más de veinticuatro horas, sino que se hallaba 
rodeada de comida dentro del aparato. Como muestran las curvas Bi 
y Ba de la figura 148 (correspondientes a las mismas ratas que en A) se 
procedió a una ulterior extinción. El hecho de que las ratas llegaran 
a responder bajo estas circunstancias constituyó un resultado inespe- 
rado. Las veinte o treinta respuestas hechas por cada rata durante la 
primera media hora pueden deberse a la intensa actividad del día an- 
terior y pueden así representar un efecto condicionado de la droga. Hay 
que señalar que en la figura 147 apareció un desplazamiento similar. 
En las líneas verticales se administró, de nuevo, la misma dosis de ben- 
zedrina y ésta produjo un incremento de tasa inequívoco, que en el 
caso de la rata 2 fue casi tan grande como el que ocurrió el día ante- 
rior cuando la rata estaba hambrienta. 

De estos experimentos se desprende claramente que el efecto de la 
benzedrina es independiente del impulso en grado considerable. Pa- 
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rece que la droga produce un estado de excitabilidad general en el 
que se emite la respuesta característica de la situación a una elevada 
tasa. La reserva del reflejo, que en los animales no drogados controla 
la emisión, no parece verse directamente implicada. Podría decirse 
que la droga simplemente multiplica las respuestas existentes en la re- 
serva, aunque esto no sea más que una forma de hablar. Por supuesto, 


RESPUESTAS 


TIEMPO 
Ficura 148 


EFECTO DE LA BENZEDRINA SOBRE LA TASA EN LOS ÚLTIMOS ESTADIOS DE LA EXTINCIÓN 


En las líneas verticales se administró la benzedrina. Las curvas de A se obtuvieron 
bajo el impulso normal. Las curvas de B, correspondientes a las mismas ratas, se 
obtuvieron después de veinticuatro horas de acceso a la comida y con comida en las 
cajas experimentales. A pesar de la falta de impulso, la benzedrina produce un im- 
portante aumento de tasa. Nótese que las curvas se han reducido mucho en la figura 


es necesario llevar a cabo más investigaciones. Zieve (83) ha publicado 
un estudio sobre la intensificación de la actividad espontánea bajo la 
benzedrina. 

Wentink ha confirmado el efecto de la benzedrina sobre la tasa 
bajo recondicionamiento periódico, usando el mismo aparato y técnica. 


429 


La señorita Wentink también ha estudiado los efectos de una serie de 
Otras drogas y hormonas, El bromuro sódico no surtió efecto alguno 
sobre la tasa con las dosis administradas (0,018 gm., 0,0216 gm., y 
0,036 gm. en días sucesivos en ese orden), mientras que 0,022 gm. de 
fenobarbital casi anularon completamente la respuesta al cabo de diez 
minutos. La adrenalina (0,025 cc.) produjo un descenso de la tasa des- 
pués de un período de latencia de varios minutos. La tasa media de 
una hora se redujo en un 25% a un 30%. La insulina aumentó la tasa 
cuando se administró sola, pero cuando se administró combinada con 
benzedrina, que también incrementó la tasa sola, se observó una ines- 
perada y acusada disminución de la tasa en tres de las cuatro ratas. 
Pueden obtenerse detalles de estos experimentos en el informe pu- 


blicado (78). 


Otros estados de fuerza 


Para una descripción completa de la fuerza del reflejo debemos 
tomar en cuenta también ciertos estados metabólicos o patológicos del 
organismo como son la fatiga general, la asfixia y la enfermedad. Po- 
demos incluir en este apartado las lesiones operatorias y de otra índole, 
en especial las del sistema nervioso. Como en el caso de las drogas, la 
mayor parte de la información disponible sobre este amplio campo se 
presenta en forma de los términos inarticulados del lenguaje vulgar, y 
sólo puede traducirse con muchas limitaciones a términos de una for- 
mulación científica de la conducta. 

Los ejemplos más comunes de enfermedad que he observado en el 
curso de mis trabajos se limitaron a los “resfriados”, en los que a un 
descenso de hambre siguió un descenso general de fuerza y éste pare- 
ció no mostrar ningún efecto directo. En una ocasión, sin embargo, una 
rata sufrió una infección vestibular, el primer síntoma de la cual fue 
un trastorno de la postura. Su cabeza quedó torcida a un lado y, du- 
rante su progresión, hacía incipientes movimientos de balanceo. Dicha 
rata no se eliminó de los experimentos y cuando la infección se hizo 
aguda, se observó un acusado efecto sobre su conducta en el aparato. 
Poco después de que la dificultad postural empezara a notarse, la fuerza 
de la respuesta a la palanca bajo recondicionamiento periódico comen- 
zó a disminuir. Al cabo de dos días alcanzó prácticamente el punto 
cero y permaneció estacionaria durante dos días más. Entonces empezó 
a subir rápidamente y cinco días más tarde alcanzó un punto anormal- 
mente elevado en comparación con las otras ratas del experimento, y 
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hasta el fin del experimento, cuatro días más tarde, mantuvo una tasa 
de unas 600 respuestas por hora. Esta tasa era excepcionalmente alta 
teniendo en cuenta las condiciones de alimentación en vigor en aquel 
momento. Los factores responsables de este cambio no pudieron ais- 
larse en una observación casual de este tipo, pero la posibilidad de 
seguir el curso de una enfermedad, en particular de una enfermedad 
que afecta el sistema nervioso, viene claramente sugerida. 

Otro factor que produce un cambio de fuerza, por supuesto, es el 
sueño. Se observa cuando se toman registros durante varias horas y 
aparece como un cambio brusco de la tasa de respuesta desde cualquier 
valor a la sazón en vigor hasta un valor cero. No hemos llegado a de- 
terminar por observación directa si la rata se duerme, o no, en aquel 
momento. La cuestión es, simplemente, que estos cambios bruscos se 
observarán en un experimento que se extienda durante un período con- 
siderable de tiempo. 

La edad del organismo es también un factor que influye en la fuerza 
y que debe ser tomado en consideración en última instancia. El pro- 
blema de la maduración podría formularse en términos de los cambios 
de fuerza debidos a esta variable, en particular en cuanto se oponen 
al condicionamiento. 


La lista de las variables adicionales en función de las cuales está 
la fuerza del reflejo es sin duda alguna incompleta. Mi propósito al 
darla aquí tiene, simplemente, el objeto de recordar al lector las mu- 
chas variables que se han mantenido razonablemente constantes en 
los capítulos anteriores del libro e indicar la magnitud del terreno aún 
inexplorado. No creo que todos estos problemas caigan dentro del 
campo del estudioso de la conducta, pero, como ésta se ve implicada, el 
investigador debe ser capaz, al menos, de proporcionar técnicas para 
el uso de los demás. Hasta que no se hayan llevado a cabo una gran 
cantidad de investigaciones no se podrá afirmar que la formulación 
general de la conducta aquí propuesta es plenamente adecuada para 
tan magna tarea. 
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12. La conducta y el sistema 
nervioso 


Si el lector ha aceptado la formulación de la conducta propuesta en 
el capítulo 1 sin demasiadas reservas, y si ha sido razonablemente ca- 
paz de descartar puntos de vista ajenos suscitados por otras formula- 
ciones con las que está familiarizado, probablemente, no ha encontrado 
a faltar ninguna mención del sistema nervioso, en las páginas prece- 
dentes. Al considerar la conducta como un dato científico por propio 
derecho, y al proceder a examinarla de acuerdo con las prácticas cien- 
tíficas establecidas, naturalmente uno no espera encontrar neuronas, 
sinapsis o algún otro aspecto de la economía interna del organismo. Las 
entidades de este tipo se hallan situadas fuera del campo de la conduc- 
ta, tal como aquí viene definido. Si no fuera por el peso de la tradición 
en sentido contrario, no habría necesidad de mencionar el sistema 
nervioso en este punto; pero raramente se brinda un análisis de la 
conducta sin alguna referencia a los hechos y teorías neurológicas su- 
puestamente relacionados con el mismo. Aunque no tengo ninguna 
intención de tratar estos hechos o teorías con detalle, no puedo evitar 
la discusión de la creencia, casi universal, de que la ciencia de la con- 
ducta debe ser de naturaleza neurológica. 

Las formas de presentación del enfoque neurológico son demasiado 
variadas para poder considerarlas exhaustivamente. Ya he mencionado 
(en el capítulo 1) la concepción primitiva, y aún no completamente su- 
perada, de que los fenómenos de la conducta son esencialmente caóti- 
cos, pero que pueden reducirse a una especie de orden mediante la 
demostración de que dependen de un sistema interno, fundamental- 
mente determinado. Esta es la concepción que más naturalmente se 
presenta como una alternativa materialista a una concepción psíquica 
o mentalista de la conducta. La especie de homúnculo neural que se 
postula como fuerza controladora guarda una semejanza inequívoca 
con los homúnculos mentales o espirituales de los viejos sistemas y fun- 
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ciona del mismo modo para introducir un tipo de orden hipotético en 
un mundo desordenado. El argumento descansa, históricamente (y de- 
pende lógicamente), en la demostración de que los fenómenos neuroló- 
gicos, intrínsecamente, pueden someterse a leyes mejor que la conducta. 
Sólo recientemente se ha visto que este hecho no era obvio. La ciencia 
de la neurología alcanzó un grado de rigor experimental mucho antes 
que la ciencia de la conducta. Su objeto era principalmente “físico” (en 
un sentido un tanto ingenuo), mientras que los datos de la conducta 
eran evanescentes; podía adoptar los métodos y conceptos de las cien- 
cias biológicas afines a ella y podía circunscribirse más fácilmente a 
las partes aisladas de su objeto. Pero esta ventaja no se ha conservado. 
Ahora es posible aplicar técnicas científicas a la conducta de un orga- 
nismo representativo, de tal forma que la conducta aparece tan someti- 
da a leyes como el sistema nervioso. No conozco ningún material expe- 
rimental sobre el sistema nervioso, por ejemplo, que consista en curvas 
más suaves y más fácilmente reproducibles que las ilustradas en mu- 
chas de las figuras de este libro. Por consiguiente, si queremos evitar 
las influencias históricas al pronunciar un veredicto moderno, debemos 
hacer caso omiso de la prioridad de la ciencia de la neurología. Y una 
vez hayamos reconocido que las dos ciencias poseen la misma validez, 
ya no podemos suscribir el punto de vista que considera posible re- 
ducir a una orden el caos de la conducta reducible mediante el recurso 
a un sistema ordenado interno. 

Una visión neurológica más compleja, que reconoce la regularidad 
de la conducta, se basa en la afirmación de que una ley de la conducta 
no podrá validarse plenamente hasta que los fenómenos neurales que 
participan en los fenómenos observados hayam sido explicados. En 
particular, la discontinuidad de la relación entre estímulo y respuesta 
se cita como una objeción cuando se tienen en cuenta, exclusivamente, 
las correlaciones observadas en los fenómenos terminales. Se considera 
que la neurología explica las leyes de la conducta, y se mantiene que, 
al ignorar los hechos neurológicos, la ciencia de la conducta abandona 
su única esperanza de explicación. Esta concepción del fin de la cien- 
cia, por supuesto, es de mucho alcance, pero, para nuestros presentes 
propósitos, el problema puede tratarse aquí considerando el punto 
relativamente pequeño que ahora nos afecta. Para dar un ejemplo re- 
presentativo al lector, voy a pasar revista al procedimiento de investi- 
gación de los fenómenos neurales que se hallan subyacentes al tipo de 
reflejo que he llamado una respondiente. Este no es el único caso al 
que puede aplicarse el argumento, pero servirá de ilustración. 

El neurólogo empieza, al igual que el estudioso de la conducta, 
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con la observación del hecho de que un estímulo dado provoca una 
respuesta dada. Su primer paso consiste en descubrir tejido conductivo 
entre los lugares donde tienen lugar estos fenómenos, primero como 
estructura existente bruta, pero, finalmente, como una cadena de cé- 
lulas especializadas. Esta cadena es un “arco reflejo”, una entidad neu- 
rológica que no tiene contrapartida en la conducta. El arco sirve para 
explicar, ante todo, la mera conexión entre un estímulo y una respues- 
ta, exigida por su simultaneidad de ocurrencia aproximada, pero tam- 
bién debe explicar las diferencias entre sus formas. Un estímulo y una 
respuesta difieren en cuanto al momento de su inicio, duración, forma 
y cantidad de energía. Mediante diversos procedimientos, que no va- 
mos a considerar, las etapas de la conversión de un estímulo en una 
respuesta se asignan a las diversas partes del arco. Por supuesto, las 
conversiones de energía en bruto se refieren a órgano terminal y efec- 
tor, parte del tiempo transcurrido hasta el nervio aferente y eferente, 
etcétera. Mediante procesos de aislamiento lógico y quirúrgico se puede 
mostrar que cierto grupo de propiedades son independientes de la ac- 
tividad del órgano terminal, efector y tronco nervioso. Son propieda- 
des del sistema nervioso central y seguramente de los puntos de con- 
tacto entre las células nerviosas llamadas sinapsis. En el tratamiento 
clásico de Sherrington (68) las propiedades atribuibles a las sinapsis se 
expresan como diferencias entre el tronco nervioso y la conducción 
sináptica, pero pueden reformularse de una forma más simple, como 
en los ejemplos siguientes: a) transcurre un período de tiempo entre 
la llegada y la salida de una descarga en una sinapsis; b) la duración 
de la descarga eferente es, frecuentemente, mayor que la de la afe- 
rente; c) la intensidad de la descarga eferente no varía linealmente 
con la intensidad de la aferente; d) una pequeña descarga aferente a 
menudo es, por sí sola, incapaz de producir una eferente, pero es 
posible que sí lo hagan descargas posteriores que la sigan de cerca; e) 
la repetición de una descarga aferente (con ciertas especificaciones 
temporales) evoca progresivamente descargas eferentes más débiles; 
f) una segunda descarga aferente puede ser ineficaz o submáximamente 
efectiva durante un breve período de tiempo después de una prime- 
ra; g) dos descargas que lleguen a una sinapsis desde puntos origina- 
rios separados pueden combinarse produciendo una descarga eferen- 
te, etc. 

El procedimiento tradicional que la ciencia de la fisiología refleja, al 
estudiar estos hechos, ha sido establecer conceptos básicos como “con- 
ductividad”, “excitabilidad” o “resistencia” para referirse al estado de 
la sinapsis, y otros conceptos subsidiarios de “latencia”, “postdescarga”., 
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“fase refractaria”, etc., para referirse a sus procesos. En el caso (e), por 
ejemplo, se dice que las repetidas descargas aferentes aumentan la 
resistencia sináptica o reducen la excitabilidad con arreglo a la ley espe- 
cial de la “fatiga del reflejo”. Hay poca diferencia entre esta clase de 
neurología y el sistema de la conducta establecido en el capítulo 1. Los 
procesos sinápticos no se observan directamente como tales, pero se 
infieren de una comparación entre input y output de la misma forma que 
en el caso de la conducta. El concepto básico de conductividad sináptica 
o sus allegados es, para muchos propósitos, idéntico al de fuerza del 
reflejo. Las leyes de la conducta no coinciden exactamente con las de 
la sinapsis porque los papeles que juegan el órgano terminal, el tronco 
nervioso y el efector son eliminados en el último caso, pero entre ellos 
hay una correspondencia más estrecha de lo que cabría esperar. Los 
fenómenos que preceden y siguen inmediatamente al paso de una si- 
napsis tienen las dimensiones de impulsos nerviosos, y de ahí que las 
modificaciones impuestas por la sinapsis sean temporales e intensivas. 
Pero al iniciar una correlación al nivel de la conducta se presume que 
tanto el estímulo como la respuesta se miden con escalas apropiadas a 
la forma de energía involucrada en cada caso, y las formas carecen de 
importancia en las leyes principales. La descripción de un reflejo a nivel 
de la conducta se efectúa también, en gran parte, en términos de tiempo 
e intensidad. En las leyes estáticas que se aplican a un caso específico 
debe hacerse una corrección para las actividades del receptor y el efector 
al comparar las leyes correspondientes de la sinapsis; pero en las leyes 
dinámicas, que son, con mucho, las más importantes, no se precisa 
ninguna corrección. 

Los conceptos y las leyes que la fisiología refleja a este nivel, difieren 
de las de la conducta principalmente en la referencia local implicada 
en el término sinapsis. Si no fuera por esta referencia, el tradicional 
“S.N.C.” podría traducirse por “Sistema Nervioso Conceptual”. Los 
datos en los que se basa el sistema se parecen mucho a los de la ciencia 
de la conducta y puede decirse que la diferencia de formulación es tri- 
vial con respecto al papel de los hechos observados. El mismo argumento 
se aplica asimismo a otros conceptos como, por ejemplo, a la red de 
conexiones que se ofrece como explicación de las relaciones topográ- 
ficas entre estímulos y respuestas. En este caso existe, a menudo, una 
vaga referencia local; pero, en cambio, un solo “arco reflejo” es tan 
inferencial como los procesos sinápticos. Al estudiar los arcos que se 
entrelazan, a menudo es posible establecer el orden de lugares donde 
tienen lugar los fenómenos específicos hasta la vía común final, con 
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inclusión de la misma, pero existe sólo un conocimiento anatómico vago 
de la posición absoluta. En cualquiera de esos ejemplos, el avance esen- 
cial con respecto a una descripción de la conducta a su propio nivel, 
a mi juicio, es muy reducido. Una explicación de la conducta en términos 
conceptuales de este tipo no sería demasiado satisfactoria. Pero un 
Sistema Nervioso Conceptual no es, probablemente, en lo que el neu- 
rólogo piensa cuando habla de los correlatos neurales de la conducta. 
La correlación exigida como explicación pertenece a una ciencia neuro- 
lógica que completa sus referencias locales y crea técnicas para la 
observación directa de los procesos sinápticos y otros. La red debe 
reconstruirse cuidadosamente y sus partes deben describirse en térmi- 
nos fisicoquímicos. La noción de conductividad sináptica debe tradu- 
cirse a términos de permeabilidad o de concentración iónica, pongamos 
por caso; mientras que los procesos subsidiarios de latencia, fatiga, 
etcétera, deben describirse en términos que se hallen al mismo nivel. 
Se han dado pasos hipotéticos hacia un sistema de este tipo. La hipótesis 
de Sherrington (69) de las substancias o estados E. e 1 es un ejemplo fami- 
liar, También se ha empezado a acumular material factual y puede pre- 
sumirse que una ciencia del sistema nervioso empezará algún día a partir 
de la observación directa de los procesos neurales, fraguando sus con- 
ceptos y leyes de acuerdo con ello. El punto de vista neurológico debe 
interesarse por una ciencia de este tipo si quiere ofrecer una “expli- 
cación” convincente de la conducta. 


Lo que generalmente no comprenden quienes están interesados en 
establecer bases neurológicas es que es necesaria una descripción ri- 
gurosa al nivel de la conducta para la demostración de la existencia 
de un correlato neurológico. El descubrimiento de los hechos neuroló- 
gicos puede llevarse a cabo, independientemente de una ciencia de 
la conducta, si los hechos se observan directamente como cambios de te- 
jido estructurales y funcionales, pero antes de que pueda demostrarse 
de que este hecho explica un hecho de conducta, ambos deben descri- 
birse cuantitativamente y es preciso mostrar que se corresponden en 
todas sus propiedades. Este argumento se hace más convincente a me- 
dida que se desarrollan técnicas independientes en neurología y, por 
ello, se aplica más directamente a una neurología fisicoquímica que a 
una conceptual. Es decir, una demostración de correlación viene a exigir 
un rigor mayor a medida que la neurología y la ciencia de la conducta 
empiezan a operar con diferentes métodos y estudian objetos distintos. 


La independencia práctica de esos dos tipos de neurología fue afir- 
mada en publicación anterior por Forbes (42). “Puede ser que la inhi- 
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bición se oponga a la excitación afectando a la permeabilidad o a otras 
propiedades de la sinapsis e impidiendo a los impulsos que alcancen 
la motoneurona; o puede ser que actúe despertando procesos en la 
célula nerviosa que se opongan a los de la excitación. Me parece que 
los datos de que disponemos no bastan para determinar esta cuestión, 
y además de ello, considero que su solución no es esencial para consi- 
derar las propiedades dinámicas de la inhibición refleja”. Añádase a 
esto una concepción de la inhibición como propiedad de la conducta, 
y se obtienen los tres niveles a que estoy aludiendo. Al nivel de la con- 
ducta, en el capítulo 1 formulamos la ley de la inhibición de la forma 
siguiente: “La fuerza de un reflejo puede reducirse mediante la pre- 
sentación de un segundo estímulo que no tiene ninguna otra relación 
con el efector implicado”. En términos de una sinapsis conceptual, la 
fuerza llega a formularse como “conductividad” y un segundo estímulo 
se convierte en una segunda vía aferente. Las propiedades dinámicas 
de la inhibición no son seguramente muy diferentes en los dos casos. 
A nivel de una sinapsis estructural, considerada como un sistema fisi- 
coquímico, la inhibición se convierte (ahora hipotéticamente) en una 
cuestión de permeabilidad, en la inactivación de una substancia con- 
ductora (¿absorción?) o en algún proceso de este tipo. No es difícil 
establecer una correlación entre los dos primeros niveles porque los 
datos son, en gran parte, idénticos. Pero la correlación de un proceso 
fisicoquímico, una vez observado, con la inhibición, ya sea a nivel de 
la conducta o de una sinapsis inferencial requerirá una formulación 
cuantitativa rigurosa en estos niveles mencionados. Si los dos procesos 
no coinciden, la “explicación” será inadecuada. 


La misma noción de “correlato neurológico” implica lo que estoy 
afirmando aquí, a saber, que existen dos objetos de estudio indepen- 
dientes (conducta y sistema nervioso), que deben tener sus propias téc- 
nicas y métodos, y que deben producir sus datos respectivos, Ninguna 
cantidad de información sobre el segundo llegará a “explicar” el pri- 
mero o a poner orden en él sin el tratamiento analítico directo repre- 
sentado por la ciencia de la conducta. El argumento se aplica, asimis- 
mo, acertadamente, a otras ciencias que estudian los sistemas internos 
relacionados con la conducta. Ninguna información simplemente en- 
docrinológica llegará a establecer la tesis de que la personalidad es 
una cuestión de secreción glandular, o de que el pensamiento es quí- 
mico. Lo que se requiere en ambos casos, si la defensa de la tesis va 
más allá de la mera retórica, es una formulación de lo que se quiere dar 
a entender por personalidad y pensamiento, y una medición cuantitativa 
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de sus propiedades. Sólo entonces podrá demostrarse una correlacción 
válida entre un estado de secreción endocrina y un estado de conduc- 
ta. Asimismo, en las ciencias del desarrollo, ningún principio del des- 
arrollo —parte de un todo o todo de una parte— explicará un aspecto 
de la conducta hasta que este aspecto se haya descrito independien- 
temente. 


Así, pues, lo que sostengo es que no sólo una ciencia de la conduc- 
ta es independiente de la neurología, sino que debe establecerse como 
una disciplina separada prescindiendo de si algún día se intenta un 
acercamiento a la neurología. El lector puede estar de acuerdo con 
esto y, al mismo tiempo, puede objetar que el aspecto neurológico no 
debiera ser ignorado. Puede mantener que los dos campos están rela- 
cionados sin duda alguna, y que se saldría ganando mucho al explorar- 
los ambos, al mismo tiempo, en vez de suscribir al aislamiento estricto 
representado por el presente libro. Sin embargo, los argumentos en fa- 
vor de este punto de vista son mucho menos convincentes de lo que 
su actual aceptación general parecería demostrar. 


Gran parte de la tendencia a buscar en el sistema nervioso una “ex- 
plicación” de la conducta tiene su origen en las prácticas clínicas, en 
las que la explicación tiene un sentido relativamente simple. El descu- 
brimiento de una lesión cerebral como “correlato neural” de la afasia, 
pongamos por caso, constituye sin duda alguna un paso importante 
para la comprensión de la condición de un paciente. Pero el éxito de 
esta forma de hallar “lo que funciona mal” en la conducta examinando 
el sistema nervioso depende, en gran parte, de la naturaleza negativa 
del dato. La ausencia (y en muchos casos la alteración) de una función 
se describe mucho más fácilmente que la función en sí. “El sujeto 
habla”, sin lugar a dudas, es una descripción inadecuada de la conduc- 
ta verbal, que exige:un montón de precisiones. “No habla” es una des- 
cripción bastante completa del caso opuesto, en tanto se acepte la no- 
ción de hablar sin analizarla. La importancia de esta diferencia para 
la presente discusión puede destacarse comparando la correlación en- 
tre la afasia y una lesión, con la correlación entre el lenguaje normal y 
los procesos neurales implicados en el mismo. No es difícil señalar una 
mera alteración de la conducta verbal y una correspondiente alteración 
del sistema nervioso, pero casi no se ha realizado ningún progreso en 
la descripción de los mecanismos neurológicos responsables de las pro- 
piedades positivas de la conducta. Esta argumentación es provisional, 
qué duda cabe; al final puede alcanzarse una correlación de propie- 
dades importantes. El punto controvertido no es la posibilidad de una 
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correlación satisfactoria, sino su significación. Aunque el descubrimien- 
to de una lesión puede ser de primera importancia para fines de diag- 
nóstico o de prognosis, una descripción de los fenómenos de la afasia, 
en su relación con la conducta verbal normal, se ve facilitada muy poco 
o nada gracias a estos conocimientos adicionales. El hecho de si decide 
realizar, o no, esta incursión en el sistema nervioso constituye plena- 
mente una cuestión relativa a los intereses del investigador. En general, 
una ciencia de la conducta descriptiva puede hacer muy poco uso de 
las prácticas del clínico, excepto en la medida en que son descriptivas. 
En general, en la búsqueda del correlato neural, el aspecto descriptivo 
se pasa por alto. Por ello, para seguir con el ejemplo de la afasia, la 
monumental obra de Head (43) es de poco valor para el estudioso de 
la conducta porque su análisis de la naturaleza y la función del len- 
guaje es anticuado y oscuro. 


La práctica clínica de examinar el interior del organismo se apoya 
en la extendida creencia de que los hechos neurológicos, en cierta for- 
ma, iluminan la conducta. Si mi formulación de la relación entre estos 
dos campos es esencialmente correcta, la creencia es infundada. Eviden- 
temente brota de la vieja concepción de que la conducta es caótica. 
Si existe algún tipo de iluminación, es en el otro sentido. La conducta 
es, con mucho, el más fácilmente observable de los dos campos, y la 
existencia de una ciencia intermedia que trata de un sistema nervioso 
conceptual atestigua la importancia de las inferencias a partir de la 
conducta, en neurología. En todo caso, me aventuraré a afirmar que, 
hasta el presente, ningún hecho del sistema nervioso ha enseñado a 
alguien algo nuevo sobre la conducta y, desde el punto de vista de una 
ciencia descriptiva, éste es el único criterio a tener en cuenta. 


La misma afirmación de la relación entre neurología y conducta ser- 
virá para descartar la pretensión de que la neurología brinda una des- 
cripción más simple de los hechos de la conducta. Esta concepción nos 
recuerda, una vez más, la creencia de que no debe buscarse la simpli- 
cidad en la conducta en sí; aunque, al margen de ella, se sostenga que, 
al fin y al cabo, diferentes clases de hechos de la conducta resultan 
proceder de un solo origen neurológico y que el número de términos 
requeridos para la descripción, por consiguiente, pueden reducirse 
apelando a términos neurológicos. Esta concepción se halla, tal vez, en 
la base de la interpretación de las “ondas cerebrales” como base del 
pensamiento o de las secreciones endocrinas como base de la persona- 
lidad, ya que el sistema fisiológico es, aparentemente, más simple que 
la conducta a explicar. Pero no estoy en condiciones de decir qué tipo 
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de correspondencia entre conducta y fisiología esto implica. O bien no 
se trata de una correspondencia unívoca o bien debe de existir una 
propiedad “simplificatoria” común en la propia conducta. Si, por ejem- 
plo, el descubrimiento de un solo tipo de proceso sináptico algún día 
llega a explicar los diversos tipos de “aprendizaje” estudiados en los 
capítulos anteriores, sólo puede explicarlos satisfactoriamente si puede 
demostrarse la existencia de una propiedad común entre los varios ca- 
sos, al nivel de la conducta. La ciencia de la conducta, naturalmente, 
aspira a la reducción de procesos aparentemente diversos a leyes sim- 
ples. En el momento presente, no sé de ninguna simplificación de la 
conducta que pueda atribuirse a un hecho neurológico. Se va logrando 
cada vez más una mayor simplicidad, pero ello gracias a un tratamiento 
sistemático de la conducta a su propio nivel. 


Otra objeción al desarrollo independiente de una ciencia de la con- 
ducta se presenta afirmando que una investigación de la relación con 
el sistema nervioso puede originar hipótesis útiles y, por ello, una frue- 
tífera experimentación. Puede ser cierto, señala esta objeción, que una 
completa descripción de ambos términos sea necesaria para demostrar 
una rigurosa correlación, pero una correlación tentativa, basada en 
escasa información, sugerirá importante experimentación en ambos 
campos. En la medida en que este argumento se apoya en lo que se 
considera como experimentación importante, se trata de una cuestión 
de gustos y no hay forma de discutirlo. Pero el tipo de experimenta- 
ción sugerido por tales hipótesis se dirige seguramente a establecer 
una mejor correlación en vez de hacer avanzar ambos campos por se- 
parado y, de ahí, que la respuesta a la objeción se reduzca al argu- 
mento, ya aducido, referente a la tentativa de correlación. En cuanto 
a la investigación que no se propone establecer correlaciones, los pun- 
tos significativos de ataque se determinan más oportunamente a partir 
de una sistematización de los datos. Es ciertamente posible programar 
investigaciones en el campo de la conducta sin prestar atención a la 
neurología y (podemos añadir) con la expectativa de que el resultado 
aportará algo de mayor permanencia que la invalidación de una hipó- 
tesis. El provecho que la ciencia de la conducta ha sacado de las 
hipótesis neurológicas en el pasado, a mi juicio, se ve ciertamente con- 
trarrestado por toda la equivocada investigación y la vana teorización 
que han partido del mismo origen. 


A menos que el lector haya captado claramente la concepción de 
una ciencia de la conducta independiente, no es probable que quede 


440 


convencido por estos argumentos. Una ciencia puramente descriptiva 
no es nunca popular. Para el hombre, cuya curiosidad por la naturaleza 
no iguala su interés por la exactitud de sus intuiciones, la hipótesis es 
el mismo nervio de la ciencia. Y la oposición a la pura descripción qui- 
zás no es tan fuerte en ninguna parte como en el campo de la conducta. 
No puede esperar que una mera demostración de la independencia 
de la ciencia de la conducta disuada al lector de su convicción de que 
las dos disciplinas deban seguir juntas y tan estrechamente unidas co- 
mo en el momento actual. Sin embargo, existen argumentos de carácter 
más positivo que debiera tomar en consideración. 

El primero de ellos es higiénico. Una definición de los términos de 
una ciencia de la conducta a su propio nivel ofrece la tremenda ventaja 
de mantener al investigador consciente de lo que sabe y de lo que 
no sabe. El uso de términos con referencias neurológicas cuando las 
observaciones en que se basan son conductuales induce a error. En- 
tonces surge una concepción enteramente errónea del estado actual del 
conocimiento. Un ejemplo prominente es la disposición sistemática de 
datos proporcionada por Pavlov. El subtítulo de su obra Reflejos condi- 
cionados es “Una investigación de la actividad fisiológica de la corteza 
cerebral”; sin embargo, no se citan observaciones directas del córtex. 
Los datos suministrados, evidentemente, se refieren a la conducta de 
perros razonablemente intactos, y el único sistema nervioso del que 
habla es el conceptual, que hemos mencionado más arriba. Este proce- 
dimiento es legítimo, en tanto que las leyes establecidas no se utilicen 
para “explicar” las mismas observaciones sobre las que se basan; pero 
este procedimiento es corriente: véase, por ejemplo, Holt (45). El pro- 
cedimiento de Holt es especialmente interesante porque es claramente 
consciente del tipo de falacia de la que cae víctima. En las primeras 
páginas del libro mencionado cita la sátira de Moliére contra el 
verbalismo: 


“Un erudito doctor me pregunta la causa y la razón por la cual el 
opio provoca sueño. A lo cual contesto: porque posee una virtud sopo- 
rífera cuya naturaleza consiste en adormecer los sentidos”. 


Acto seguido procede a explicar la conducta a partir de un sistema 
nervioso conceptual. No veo mucha diferencia entre el uso del tér- 
mino instinto, al que pone objeciones, y su propia explicación del 
aprendizaje en términos de la “Ley de Pavlov”, excepto en que asigna 
una referencia neurológica a la ley, que es inexistente en el caso del 
instinto. La referencia, en la actualidad, no se ve corroborada por los 
datos. 
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Un segundo argumento para mantener la independencia de la cien- 
cia de la conducta es que entonces se ve libre de influencias restric- 
tivas innecesarias. La conducta, como ya he dicho, es mucho más 
fácilmente observable como objeto de estudio que el sistema nervioso 
y constituye un error vincular una ciencia con las dificultades inhe- 
rentes a otra. Un simple arco reflejo, identificable como tal y como 
correlato de un reflejo, en la actualidad es inaccesible. Incluso las 
propiedades dinámicas brutas son igualmente reacias. Aunque el neu- 
rólogo puede hablar, por ejemplo, de una descarga aferente del estó- 
mago o de algún otro proceso como base del hambre, que yo sepa 
no se ha diseñado ningún método que permita obtener medidas de los 
estados corticales o subcorticales del impulso resultantes, que sean 
tan precisas como las medidas de la conducta descritas en el capítu- 
lo 10. Nos colocaríamos en una situación de desventaja si tuviéramos 
que aguardar hasta que se diseñaran métodos para la investigación de 
los correlatos neurológicos para validar las leyes de la conducta. Es 
especialmente necesario evitar restringir el término reflejo a las corre- 
laciones cuyos arcos han sido localizados. Esta restricción corriente- 
mente viene propugnada por el neurólogo, que tal vez se ve justifica- 
blemente consternado ante las llamadas “unidades” de conducta que 
se crean en los trabajos psicológicos. Pero el aislamiento de un arco 
no es un criterio útil al que recurrir con objeto de excluir el uso erró- 
neo de la noción de unidad. Existen otros criterios, como, por ejemplo, 
los considerados en el capítolo 1, que se basan en el sometimiento a 
leyes de la unidad durante los diversos cambios en su estado. 


La moda en boga de tratar de buscar en un hecho de la conducta 
sus correlatos neurológicos en lugar de validar el hecho como tal y, 
luego, proceder a tratar otros problemas de la conducta, obstaculiza 
enormemente el desarrollo de la ciencia de la conducta. El primero de 
los experimentos descritos en este libro era sobre el cambio de la tasa 
de la ingestión de comida. El curso “natural” hubiera sido centrarse en 
la identificación de los procesos fisiológicos con los que el cambio es- 
taba correlacionado. Eran posibles varias hipótesis: la curva reflejaba 
un cambio de la condición del estómago, de la concentración del azúcar 
en la sangre o la oxidación de una “hormona de hambre”, etc. Sin 
duda alguna hubiera sido una línea de investigación provechosa, pero 
hubiese significado la renuncia al interés por la propia conducta. 
Para el propósito de una descripción de la conducta conforme a leyes, 
el cambio cuantitativo de la fuerza del reflejo ingestivo era suficiente. 
Ninguna detección de un cambio fisiológico correlacionado hubiera 
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incrementado la validez de la ley, y, en cambio, se podía aprender más 
sobre la conducta examinando otras leyes a nivel de la conducta. Entre 
tanto, el fisiólogo podía así disponer de un método de investigación, 
siempre que quisiera trabajar en su faceta de la correlación. 


No pretendo ignorar el avance que supone para la unificación del 
conocimiento el hecho de que los términos a un nivel de análisis sean 
definidos (“explicados”) a otro nivel. En último término se puede lo- 
grar una síntesis de las leyes de la conducta y del sistema nervioso, 
aunque la reducción a términos inferiores, por supuesto, no se detendrá 
al nivel de la neurología. La descripción final vendrá dada en términos 
de las unidades físicas quasi-últimas que en aquel momento estén en 
boga. Hasta qué punto tendrá importancia un avance de este tipo de- 
penderá de la concepción de la ciencia como totalidad, que cada uno 
tenga. Uno de los objetivos de la ciencia es seguramente la formulación 
de todo conocimiento en un “lenguaje” único (38). Otro, es la predic- 
ción y el control dentro de un campo único. Lo que estoy defendiendo 
aquí es la ventaja que se puede obtener del estudio riguroso de un 
campo dentro de sus límites. 

El cultivo intenso de un solo campo debe recomendarse no sólo en 
su propio beneficio, sino en aras de un progreso más rápido hacia una 
síntesis última. Lejos de estorbar a la neurología, una ciencia de la 
conducta independiente tiene mucho que ofrecerle. Una minuciosa sis- 
tematización e investigación de la conducta es valiosa para cualquiera 
que toma la conducta como punto de partida y busca una explicación 
en términos neurológicos. El neurólogo, hasta ahora, ha sido capaz de 
seguir sin su ayuda porque se ha limitado a casos relativamente sim- 
ples. Todavía no ha alcanzado el punto en que una concepción popu- 
lar de la conducta se desmorona. Una teoría neurológica del aprendi- 
zaje actual, por ejemplo, puede contentarse con la noción simple de 
conexiones sensorimotoras (cf. neurobiotaxis) porque tanto los hechos 
neurológicos como los conductuales (en menor grado) son tan escasos 
que una teoría más sólida sería vana. Al final, sin embargo, sólo la más 
rigurosa formulación del aprendizaje será satisfactoria para un punto 
de partida neurológico, y es posible que en ella la mera conexión de 
vías parezca trivial. Como proposición general podemos decir que los 
hechos de la conducta a los que ahora apela la neurología pueden ser 
satisfactorios sólo en los primeros estadios de una ciencia. Sería de- 
masiado pedir que el neurólogo refinara ambos campos, a medida que 
avanza. Si tendrá que hacerlo, o no, dependerá en gran medida del 
futuro de la ciencia de la conducta. 


443 


Quizás puedo indicar mejor el tipo de contribución que cabe espe- 
rar de una ciencia de la conducta seleccionando de los capítulos ante- 
riores una serie de propiedades o aspectos de la conducta que ya son 
de una importancia obvia para la neurología en su exploración de los 
correlatos neurológicos. 


1. La uniformidad de los cambios en la tasa de emisión de una 
respuesta relativamente compleja como “apretar la palanca” y la divi- 
sión práctica del acto total en las partes componentes de una cadena 
de reflejos. En vista de las controversias actuales sobre el análisis de 
la conducta y la posibilidad de identificar unidades funcionales, la 
regularidad de muchos de los procesos aquí mencionados debería de 
ser tranquilizadora para el neurólogo que desea preservar la hipótesis 
de un “centro” unitario en conexión con un acto relativamente com- 
plejo. No obstante, la obvia naturaleza genérica de la respuesta en 
cuanto se mide conductualmente plantea un agudo problema para la 
neurología que, en su mayor parte, puede ignorarse en la conducta. 


2. El concepto de la fuerza del reflejo y su utilidad para formular 
las principales leyes dinámicas. El paralelo neurológico de la fuerza 
es alguna forma de conductividad o excitabilidad sináptica. La reduc- 
ción de los principales fenómenos de la conducta (impulso, condiciona- 
miento, discriminación, emoción, etc.) a estados de la fuerza del reflejo 
presenta un problema mucho más simplificado a la neurología. 

3. La noción de conducta operante y su emisión en vez de su pro- 
vocación. La noción de conductividad como la función esencial de un 
centro debe complementarse con un estado de excitación en el que 
los impulsos nerviosos se emiten simplemente. 

4. La distinción entre las diversas funciones de los estímulos. Un 
estímulo discriminativo que ocasiona la emisión de una respuesta (que 
“determina la ocasión” para la respuesta) difiere cuantitativamente en 
su acción del estímulo provocador y debe “explicarse” a base de un 
mecanismo neurológico diferente. 


5. La concepción de los impulsos y emociones como estados en lu- 
gar de como estímulos y respuestas. La búsqueda de la estimulación 
aferente específica a cada impulso ha sido, con muy pocas excepciones, 
fútil e incluso ridícula. El intento de definir las emociones en términos 
de respuestas específicas no ha salido mejor parado. Ambas empresas 
pueden dar origen a un análisis de los estados de excitabilidad de los 
reflejos covariantes y de las fuerzas que producen cambios en ellos 
(quizás incluyendo, en parte, la estimulación aferente). 
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6. La agrupación de los reflejos de acuerdo con los impulsos y la 
emoción. El esquema tradicional de la organización sensorimotora en 
el cerebro no presta atención alguna a las covariaciones de reflejos, 
no relacionados en otros aspectos durante los cambios de impulso y 
emoción. Debe descubrirse alguna organización adicional que explique 
estos hechos obvios. 

7. La reserva del reflejo. El concepto de reserva exige un meca- 
nismo neurológico de índole diferente de la excitabilidad o conducti- 
vidad momentánea de un centro o de la mera conexión de vías. Sea 
cual sea el estado o condición que resulte corresponder a la reserva, 
debe de tener la propiedad de sobrevivir durante períodos de tiempo 
relativamente largos sin cambio significativo de magnitud, y debe obe- 
decer a las demás leyes aquí establecidas. 

8. La relación entre la reserva y la fuerza momentánea. El meca- 
nismo de (7) debe hallarse bajo el control de otro mecanismo para 
producir (5). La diferencia, por ejemplo, entre una reserva vacía y una 
reserva llena sin ningún impulso, o una reserva llena bajo emoción, 
está clara al nivel de la conducta y debe tener cierta contrapartida 
neurológica. 

9. La distinción entre condicionamiento tipo R y tipo S, y la 
formulación de tipos en términos de las contingencias del reforzamiento. 
Los esquemas que explican el tipo S en términos de vías simultánea- 
mente activas son inadecuados para el tipo KR, que presenta un pro- 
blema especial en la acción aparentemente retroactiva del reforzamiento. 

10. Un análisis del concepto de inhibición. La repetida objeción 
al hecho de basar un término solamente en la dirección del cambio en 
la fuerza del reflejo, se aplica asimismo a las hipótesis neurológicas. 
Puede requerirse una variedad de procesos neurológicos para explicar 
los casos comúnmente designados con un solo término. 

11. La formulación de una discriminación temporal. El papel del 
tiempo en una discriminación de la conducta tiene muchas repercusio- 
nes sobre los procesos neurológicos (cf. el “estímulo de huella”). Es 
necesaria una cuidadosa reconsideración de las concepciones popula- 
res si queremos que la experimentación sobre el “tiempo biológico” del 
organismo tenga sentido. 

12. El análisis de la diferenciación de una respuesta. Como en el 
caso del condicionamiento operante, una analogía con el teléfono deja 
de ser aplicable cuando se hacen cambios topográficos. La diferen- 
ciación de la intensidad de la respuesta exige la modificación de la 
teoría neurológica del aprendizaje. 
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La lista podría extenderse y la argumentación en favor de su sig- 
nificación en neurología podría ampliarse considerablemente. En efecto, 
si debiéramos volver nuestros ojos hacia la historia de la teorización 
neurológica para nuestros ejemplos de los criterios de prueba y para 
nuestras normas para la adecuación de los hechos, una cantidad de es- 
peculación realmente prodigiosa podría basarse en el presente material 
experimental. Al igual que Los reflejos condicionados, de Pavlov, el 
libro podría haberse presentado como un tratado de neurología. Ya he 
expresado mi creencia de que una explicación que no sea una mera 
traducción de los datos de la conducta en términos neurológicos hipo- 
téticos debe ser fruto de técnicas neurológicas independientes, cuyo 
desarrollo cae fuera de los límites de una ciencia de la conducta. Al 
dejar el material de esta forma, quedará ilustrada la relación entre una 
ciencia de la conducta y la neurología que puede resultar más prove- 
chosa. En el caso de la mayoría de puntos enumerados, se han esta- 
blecido bastante bien una serie de propiedades cuantitativas. Esta 
cuantificación, junto con una formulación rigurosa, es la que sitúa a 
la ciencia de la conducta en una posición completamente diferente de la 
observación y el análisis accidental. 

Una ciencia cuantitativa de la conducta puede considerarse como 
una especie de termodinámica del sistema nervioso. Suministra des- 
cripciones de la actividad del sistema nervioso de la mayor generali- 
dad posible. La neurología no puede probar que estas leyes son falsas 
ni son válidas al nivel de la conducta. No sólo las leyes de la conducta 
son independientes de su soporte neurológico, sino que, en realidad, 
imponen ciertas condiciones limitativas sobre toda ciencia que empren- 
da el estudio de la economía interna del organismo. La contribución 
que una ciencia de la conducta hace a la neurología es una formula- 
ción rigurosa y cuantitativa del programa que tiene ante sí. 


La relación entre la neurología y la ciencia de la conducta que he 
tratado de exponer es algo que Mach (60) ha expresado de una forma un 
tanto más moderada al principio de un capítulo sobre Física y Biología : 


«A menudo sucede que el desarrollo de dos diferentes campos de la 
ciencia corre paralelo durante largos períodos, sin que ninguno de 
ellos ejerza influencia sobre el otro. En ocasiones pueden llegar a apro- 
ximarse mucho, cuando se advierte que las doctrinas de una de ellas 
arrojan una luz inesperada sobre las doctrinas de la otra. En este caso, 
puede incluso manifestarse la tendencia natural que permita que el 
campo de ésta Negue a quedar completamente absorbido por el campo 
de aquélla. Pero el período de esperanza ilimitada, el período de su- 
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perestimación de esta relación que se supone que lo explica todo, va 
seguido rápidamente por un período de desilusión, cuando los dos cam- 
pos en cuestión se separan una vez más y cada uno persigue sus pro- 
pios objetivos, planteando sus propias cuestiones especiales y aplicando 
sus propios métodos. Sin embargo, en ambas ciencias el contacto tem- 
poral deja tras él huellas imborrables. Aparte de la adición positiva al 
conocimiento, que no se puede despreciar, la relación temporal entre 
ellas ocasiona una transformación de nuestras concepciones, clarificán- 
dolas y permitiendo su aplicación sobre un campo más amplio que 
aquel para el que se formaron originalmente». 


HE 
Ha 
l 


13. Conclusión 


Sería conveniente comentar en términos algo más generales la siste- 
matización de la conducta propuesta en las páginas precedentes. Apenas 
es preciso señalar dos importantes características. La obra es “me- 
canicista” en el sentido de implicar una regularidad u orden fundamen- 
tal en la conducta de los organismos y es francamente analítica. No es 
necesariamente mecanicista en el sentido de reducir los fenómenos de 
la conducta en última instancia al movimiento de partículas, ya que no 
se hace dicha reducción ni se considera esencial; pero se presupone 
que la conducta es predictible a partir del conocimiento de las varia- 
bles relevantes y es libre de la intervención de cualquier agente capri- 
choso. El uso del análisis parece absolutamente necesario en una cien- 
cia de este tipo y no conozco ningún caso en el que, en la práctica, se 
haya evitado realmente. La forma en que se define “apretar una palan- 
ca” como unidad de conducta y el modo en que la unidad se valida 
experimentalmente están, así lo espero, más allá del alcance de las 
críticas corrientes de las fórmulas supersimplificadas del estímulo-res- 
puesta. 

Lo que hemos llamado la descripción topográfica de la conducta in- 
cluye la enumeración y la clasificación de los reflejos, de las operaciones 
que producen cambios de la fuerza del reflejo y de los grupos de refle- 
jos afectados por tales operaciones. Pero ni un reflejo ni un grupo de 
reflejos apropiados, pongamos por caso, a un impulso o emoción pueden 
identificarse sólo a partir de rasgos topográficos. Una parte de la con- 
ducta, aislable en términos de un esquema clasificatorio, no se identi- 
fica como una unidad de conducta hasta que se han demostrado ciertas 
propiedades dinámicas, así como tampoco puede identificarse la con- 
ducta característica de un impulso o emoción salvo en términos de 
propiedades dinámicas. Así pues, en una ciencia de este tipo no existe 
ningún campo fisionómico o taxonómico independiente. Una descripción 
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clasificatoria satisfactoria puede resultar inútil al aplicarse al aspecto 
dinámico de la conducta. 


En una ciencia de la conducta las propiedades dinámicas fundamen- 
tales sólo pueden investigarse apropiadamente en el laboratorio. La ob- 
servación casual o incluso clínica no se adapta al estudio de procesos, 
en cuanto éstos difieren de los rasgos momentáneos. Un proceso, que 
necesariamente implica el factor tiempo, sólo puede hacerse accesible 
al análisis mediante el uso de observaciones y registros cuantitativos. 
Como es experimental, una ciencia de la conducta puede pretender 
justificadamente una mayor validez que las formulaciones filosóficas o 
populares siempre que surge un desacuerdo, pero la ventaja que se ob- 
tiene del experimento a menudo se comprende mal. No se trata sim- 
plemente de que la experimentación proporciona datos adicionales o 
que dichos datos son más fiables, o que al experimentar estamos en con- 
diciones de verificar hipótesis confrontándolas con la realidad. La ven- 
taja principal, que nos compensa de la necesidad de subordinar una 
descripción topográfica a una investigación experimental de los procesos 
dinámicos, radica en que obtenemos un sistema de conducta que tiene 
una estructura determinada por la propia naturaleza del objeto estu- 
diado. 


El término sistema, al ser aplicado a la conducta oscila, frecuente- 
mente, entre dos significados bastante distintos. Por una parte, puede 
referirse a una compilación o clasificación sistemática de datos por 
parte de alguna persona o escuela, a menudo mediante el uso de una 
terminología especial. Corrientemente, se expresa la opinión, tal vez con 
cierta justificación, de que ya disponemos de bastantes sistemas de este 
tipo. Sin la restricción suministrada por la consideración de las propie- 
dades dinámicas, una descripción puramente topográfica puede llevarse 
a cabo de muchas maneras diferentes y, por lo tanto, los investigadores 
pueden obtener, en este sentido, sistemas diferentes. Si nos limitamos 
sólo al terreno topográfico es posible que no haya forma de alcanzar un 
acuerdo. Por ejemplo, gran parte de la conducta de un organismo pue- 
de llamarse sexual si lleva la contraseña apropiada de acuerdo con al- 
gún esquema de clasificación. No hay nada que impida a nadie hacer 
esta clasificación si sólo se tienen en cuenta los rasgos de la conducta, 
ni llevar a cabo otra clasificación en la que se daría al término “sexual” 
una aplicación más limitada o conflictiva. Los desacuerdos entre los 
sistemas de este tipo son en gran parte verbales. 


Un segundo tipo de sistema, al que aquí nos referimos, viene clara- 
mente ejemplificado por los sistemas que encontramos en la fisicoquí- 
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mica. Este sistema consiste en una agregación de variables relaciona- 
das, escogidas por conveniencias de investigación y descripción, entre 
todos los fenómenos que se presentan en un campo científico dado. En 
el caso de la conducta, se puede llegar a un sistema de este tipo sólo a 
través del tipo de análisis experimental al que consagramos este libro, 
en el que se identifican las partes o aspectos de la conducta que sufren 
cambios y se establecen sus relaciones mutuas. 

Las diferencias notables que existen, actualmente, entre los sistemas 
de conducta corriente, que no son meramente topográficos, parecen ser 
el resultado de diferencias en este estadio elemental de la selección de 
variables. No hay ningún acuerdo general en cuanto a cuáles son las 
principales variables de la conducta. Muy a menudo, no se intenta de- 
finirlas explícitamente: un investigador simplemente amplía algún siste- 
ma filosófico o popular e introduce, en unos pocos puntos, unos nuevos 
términos definidos. Por otra parte, también se seleccionan variables que 
produzcan un sistema conveniente, pero que no son representativas de 
la totalidad de la conducta. Trataré de elaborar esos puntos conside- 
rando una serie de ejemplos corrientes. 

Un sistema de conducta basado en el concepto del tropismo parece 
satisfacer los requerimientos de un sistema en este sentido, salvo en el 
punto de la generalidad. En los extensos experimentos de Crozier y 
Pincus (se puede hallar un informe conveniente de los mismos en [40)), 
se aislaron variables que son capaces de tratamiento cuantitativo y 
que se comportan conforme a leyes. Asimismo pueden combinarse para 
formar complejos mayores con efectos predecibles. Pero cualquier sis- 
tema que toma la orientación o la progresión orientada, como la única 
propiedad de la conducta que se debe explicar, y que considera un estí- 
mulo sólo como un campo de fuerza, queda seriamente limitado. En el 
caso de los organismos superiores es seguramente posible establecer, 
al menos, un sistema descriptivo independiente basado en el concepto 
de reflejo que dará un resultado igualmente satisfactorio.. Cuando la 
conducta consiste, en gran parte, en orientación y cuando los estímulos 
son campos de fuerza, podemos preferir el concepto de tropismo debi- 
do a su simplicidad, rechazándolo al mismo tiempo en el caso de orga- 
nismos más complicados. 

Casi se ha dirigido la misma objeción contra los conceptos de Le- 
win (58) de vectores y valencias. Este sistema se aplica fácilmente a la 
conducta, la cual puede concebirse como orientación y movimiento en 


1. Compárese la objeción de Hunter a los trabajos sobre los tropismos de 
los mamíferos (50, 51). 
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un campo de fuerza y en el que puede decirse que el estímulo genera 
dicho campo, pero no es un sistema oportuno para estudiar otros tipos 
de conducta en respuesta a otros tipos de estímulos. La conducta de 
campo de esta índole puede tratarse seguramente también en términos 
de estímulo y respuesta tal como aquí los hemos definido y, por consi- 
guiente, se puede pretender una mayor generalidad para el reflejo. 
Otra ventaja del reflejo sobre el vector o valencia es que la conducta 
se define con una referencia más acusada a la topografía del organismo, 
como se advertirá inmediatamente. 


Un tercer sistema corriente de cierta importancia, en el que el pro- 
blema del aislamiento de variables se agudiza, ha sido elaborado por 
Hull (49). Hull empieza definiendo una serie de términos, algunos de los 
cuales (verbigracia, “extinción”, “reforzamiento”) tienen un sentido más 
o menos técnico, pero la mayoría de los cuales (verbigracia, “desánimo”, 
“éxito”, “decepción”, “frustración”) proceden del vocabulario vulgar o 
de diversos sistemas psicológicos. Con la ayuda de ciertos postulados 
(verbigracia, “Cada reacción de un organismo origina un estímulo in- 
terno más o menos característico”), Hull formula y prueba una serie 
de teoremas (verbigracia, “Los organismos capaces de adquirir tenden- 
cias excitadoras competitivas manifestarán desánimo”). La demostración 
de teoremas de esta índole se ofrece como “evidencia específica de que 
tales problemas, considerados durante mucho tiempo como formando 
parte del campo peculiar de la filosofía, ahora son susceptibles de ata- 
que por parte de una metodología científica estrictamente ortodoxa”. 


La virtud de la obra de Hull reside en su insistencia sobre la vali- 
dación experimental de los enunciados de la conducta y sobre la nece- 
sidad de limitarse a formulaciones que son internamente congruentes 
y que pueden verificarse experimentalmente. Pero ha sido incapaz de 
establecer un sistema de conducta distinto de un método de verificación. 
Los únicos términos de su lista que podrían considerarse como variables 
fundamentales se introducen sin definición (verbigracia, “reacción”, 
“complejo de estímulos” y “tendencia excitadora”, que es su versión más 
aproximada de “fuerza”). Muchos de los términos que define son super- 
fluos, extraídos de diversas fuentes inagotables. Podrían obtenerse fá- 
cilmente varios centenares de definiciones del mismo tipo y de ellas 
podrían derivarse un número asombroso de teoremas. No proporciona 
ningún procedimiento para reducir el número de términos necesarios 
a un mínimo y no existe garantía alguna de que este método pueda nun- 
ca alcanzar por sí solo la última simplicidad de formulación que es razo- 
nable exigir de un sistema científico. Los términos que Hull selecciona 


451 


no componen un sistema en el presente sentido y tampoco ha aplicado 
realmente su metodología al problema de diseñar dicho sistema. 

Partiendo de un procedimiento deductivo, Hull, necesariamente, ha 
convertido la formulación de hipótesis y el diseño de experimentos 
críticos en las actividades centrales de una investigación de la con- 
ducta. En los capítulos anteriores se puede hallar una perspectiva com- 
pletamente distinta. La deducción y la verificación de hipótesis son, 
en realidad, procesos subordinados en una ciencia descriptiva, la cual 
avanza, en gran parte o totalmente, sin hipótesis hacia la determinación 
cuantitativa de las propiedades de la conducta, y, mediante la induc- 
ción, hacia el establecimiento de leyes. La dificultad parece radicar en 
el modelo que Hull ha escogido. Una ciencia de la conducta no puede 
estructurarse a imagen de la geometría o de la mecánica newtoniana 
porque sus problemas no son necesariamente de la misma índole. Esto 
es específicamente cierto con respecto al problema de aislar variables 
fundamentales, Si Hull hubiera elegido la física experimental o la quí- 
mica como modelo, el lugar de la deducción en su sistema hubiera sido 
mucho menos importante. 

Tolman ha presentado un sistema que bajo muchos aspectos es pa- 
recido al descrito aquí (72, 73)? Se toma la conducta como variable de- 
pendiente y se muestra que está en función de la edad, de la herencia, 
de las operaciones que modifican el impulso, etc. Lo que aquí hemos 
tratado como un “estado”, en cuanto se distingue de la operación res- 
ponsable del estado, es designado por Tolman una “variable intervi- 
niente”. Por ejemplo, su “demanda” de comida es equivalente a un 
“estado de hambre”; tampoco debe identificarse con la operación que 
vuelve hambriento a un organismo, y ambos se infieren del efecto 
de la operación sobre la conducta. En el sistema de Tolman la noción de 
“fuerza” queda dividida en “hipótesis”, “demandas”, ete.. con arreglo 
a los tipos de operaciones responsables de la fuerza. Pero la misma 
noción de fuerza, o su equivalente, no se desarrolla claramente, proba- 
blemente, a causa del tipo de situación a la que el sistema se aplica 
típicamente. El laberinto no es instrumento conveniente para la investi- 
gación de las propiedades dinámicas de la conducta. Aun cuando con- 
sideremos un solo “punto de elección”, siguen habiendo dos respuestas 
posibles: giro a la derecha o giro a la izquierda. La conducta en el 
laberinto no proporciona ninguna medida de las dos, ya que una 
“elección” revela sólo la mayor fuerza de una de ellas. En vez de medir 


2. Los aspectos esenciales del presente sistema que entran en la comparación 
fueron descritos en mi artículo sobre el concepto de reflejo publicado en 1981 (2). 
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la conducta directamente, Tolman se ve reducido a determinar la “ra- 
zón de conducta”, la cual es de escasa utilidad para seguir los diversos 
procesos que constituyen los principales objetos de investigación. 


Que surjan diferencias sobre la cuestión de las variables fundamen- 
tales en un estadio primerizo de la historia de la ciencia, no es asom- 
broso ni alarmante. Lo importante es que se empiece a advertir la 
necesidad de un sistema en el presente sentido (en lugar de en el sen- 
tido de un vocabulario clasificatorio). Sería un acontecimiento anómalo 
en la historia de la ciencia que cualquier sistema propuesto resultara 
ser, en última instancia, el más indicado (y por ello, en lo que respecta 
a la ciencia, el más correcto). La recogida de datos relevantes no ha 
hecho más que empezar. Pero, paradójicamente, el carácter necesaria- 
mente tentativo de cada uno de los sistemas en boga no puede excusar 
plenamente la multiplicidad de sistemas en vigor. Existen criterios dis- 
ponibles con arreglo a los cuales puede juzgarse un sistema. Estos 
criterios vienen suministrados principalmente por la utilidad y la eco- 
nomía del sistema con respecto a los datos disponibles. 


Un aspecto destacado del presente libro, que es difícil ignorar, es 
el cambio de énfasis de la conducta respondiente a la operante. La 
definición de conducta como un todo dada en el capítulo 1 puede que 
no sea totalmente aceptable para el lector. Si recurrimos al efecto que el 
organismo surte sobre el ambiente, gran parte de lo que, a menudo, 
se llama conducta queda minimizado o incluso excluido. La mayoría de 
las respuestas de las glándulas y de los músculos lisos no llegan a actuar 
sobre el ambiente, dejando de presentar la visibilidad que se brinda 
como característica definitoria. Toda definición de un campo científico 
es hasta cierto punto arbitraria, pero es digno de señalar que, si quere- 
mos hacer de la conducta operante una materia científica, debemos 
evitar muchos de estos problemas. La conducta operante claramente 
satisface una definición basada en el efecto que el organismo surte so- 
bre el ambiente, y se plantea la cuestión de si no constituye propiamen- 
te el objeto principal del estudioso de la conducta y de si la conducta 
respondiente, que esencialmente está conectada a la economía interna 
del organismo, no puede dejarse razonablemente en manos del fisiólogo. 
La conducta operante, con su relación única con el medio ambiente, pre- 
senta un importante campo de investigación separado. Los hechos de 
la conducta respondiente que se han considerado como datos funda- 
mentales en la ciencia de la conducta (Sherrington, Pavlov y otros), 
como hemos visto, no pueden extrapolarse útilmente a la totalidad de 
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la conducta y tampoco constituyen un cuerpo de información muy 
grande que sea valioso para el estudio de la conducta operante. 


Aunque puede hacerse una distinción entre el campo operante y el 
respondiente, también hay una cierta continuidad, que he tratado de 
señalar, empezando con las leyes respondientes y comparando el condi- 
cionamiento tipo S (que es en gran parte, si no del todo, respondiente) 
con el tipo R (que en apariencia es totalmente operante). Una especie 
de continuidad más importante se manifiesta con el uso del término 
“reflejo” en ambos campos. Esto es, hasta cierto punto, una cuestión 
controvertida. En la conducta operante, el significado original figura- 
tivo del reflejo se pierde, puesto que no hay ningún estímulo que 
“reflejar” en forma de respuesta. También es cierto que al haber sido 
aplicado primero a ejemplos respondientes, el término ha adquirido 
connotaciones incidentales (especialmente en su uso neurológico) que 
se oponen al uso general que de él hacemos aquí. Pero he tratado de 
mostrar en otra publicación, (2) a partir de la consideración de la historia 
del término, que muchas de sus connotaciones han surgido, no del des- 
cubrimiento de información adicional, sino de los prejuicios y precon- 
cepciones referentes a la conducta de los organismos. El simple hecho 
positivo de la correlación entre estímulo y respuesta ha dado lugar, 
innecesariamente, a una elaborada definición negativa de una acción 
“no aprendida, inconsciente e involuntaria”. Pavlov ha extendido el tér- 
mino al campo del “aprendizaje”, mostrando que se puede obtener el 
mismo tipo de relación entre estímulo y respuesta en la conducta ad- 
quirida. La propiedad de la “conciencia” es irrelevante o ineficaz a la 
hora de diferenciar entre dos tipos de conducta. La distinción restante 
entre voluntaria e involuntaria (cf. 65), probablemente presenta un 
estrecho paralelismo con la distinción operante-respondiente, pero su 
uso tradicional al definir un reflejo, se halla más íntimamente relacio- 
nado a la cuestión de la predictibilidad o la libertad, que aquí no nos 
interesa. Una definición que respete los datos reales puede derivarse 
de la simple observación de la correlación entre estímulo y respuesta. 
De forma algo más general, el término se aplica a una forma de predecir 
la conducta o a una unidad predecible. En este sentido amplio, el con- 
cepto de reflejo es útil y aplicable siempre que se pueda lograr la pre- 
dictibilidad. Su campo semántico se ha incrementado regularmente, a 
medida que se ha sometido, cada vez más, conducta a control experi- 
mental, y su última extensión a la totalidad de la conducta es una con- 
secuencia natural de una creciente demostración de su conformidad a 
leyes. 


454 


Se ha observado una importante práctica en el estudio tradicional 
de los reflejos que es de importancia capital en el tipo de sistema aquí 
establecido, y que sostiene el uso extendido del término. Se trata de 
la práctica de referirse a movimientos específicos de partes del organis- 
mo. A pesar de la naturaleza genérica del término, la referencia topo- 
gráfica ha sido siempre relativamente estricta y precisa. Una de las 
razones por las cuales esto es importante es que los fenómenos están 
entonces en mejores condiciones de ser reducidos a términos neurológi- 
cos. Este argumento puede sorprender al lector después de la argumen- 
tación sostenida en el capítulo anterior, pero estoy de acuerdo con 
Carmichael (37) en que “los conceptos que no hacen imposible la for- 
mulación fisiológica y que son responsables del desarrollo del conoci- 
miento fisiológico son preferibles, en igualdad de condiciones, a los que 
no lo son”. La principal importancia de una acentuada referencia a la 
conducta, sin embargo, no es que una investigación neurológica se vea 
facilitada, sino que el valor descriptivo del término se conserva en su 
grado máximo. 

Esta característica puede comprenderse mejor comparando un refle- 
jo, o una ley de la fuerza del reflejo, con una ley o principio que des- 
criba la naturaleza “adaptativa” o “ajustativa” de la conducta, o alguna 
otra propiedad igualmente general. Supongamos, por ejemplo, que se 
demuestra un principio a partir del cual pueda deducirse que un orga- 
nismo, ante un obstáculo en su camino hacia una meta, permanecerá 
activo hasta que emita alguna respuesta en virtud de la cual se supere 
el obstáculo. Dada por supuesta la validez del principio, seguimos sien- 
do incapaces de decir cuál será la conducta precisa. Asimismo, un prin- 
cipio que nos permita predecir que, en una situación dada, la conducta 
tendrá “valor de supervivencia” o requerirá el “mínimo esfuerzo” puede 
ser bastante válido dentro de sus propios límites, pero carece de la es- 
pecificidad de referencia que presupone el concepto de reflejo. Que yo 
sepa, el reflejo es el único concepto histórico importante que ha res- 
petado estrechamente los movimientos reales del organismo de modo 
que el término puede preservarse justificadamente en un campo en que 
este tipo de referencia es de importancia primordial. 


Un obstáculo en el camino de la ciencia de la conducta es la inca- 
pacidad para comprender que la conducta puede tratarse como un ob- 
jeto de estudio por derecho propio. El materialista, reaccionando contra 
un sistema mentalista, es probable que ignore la conducta como objeto 
de estudio porque desea que sus conceptos se refieran a algo substan- 
cial, Es probable que considere los términos conceptuales referentes a 
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la conducta como verbales y ficticios, y en su deseo de una explicación 
material llegue a ignorar su posición en una ciencia descriptiva. Holt (45) 
adopta una posición moderna de esta suerte. Su objeción a un término 
tal como “instinto” parece reducirse a la afirmación que no se puede 
hallar el instinto disecando el organismo. Un argumento semejante se 
esgrime, comúnmente, en contra de los conceptos de “intelecto”, *volun- 
tad”, “cognición”, etc., que se han utilizado en descripciones populares 
y filosóficas de la conducta, durante siglos. Pero la objeción a tales 
términos no es que son conceptuales, sino que el análisis subyacente 2 
Su uso es débil. Los conceptos de “impulso”, “emoción”, “condiciona- 
miento”, “fuerza del reflejo”, “reserva”, etc., tienen el mismo papel 
que “voluntad” y “cognición”, pero difieren de ellos en el rigor del 
análisis por medio del que se han derivado y en la contigúidad de su 
referencia a las observaciones reales. Pese a la naturaleza conceptual de 
muchos de nuestros términos, seguimos estudiando un campo existente, 
que es la conducta del organismo en su totalidad. En este caso, como 
en las demás ciencias experimentales, un concepto no es más que un 
concepto. Si es ficticio u objetable, no puede determinarse, simple- 
mente, a partir de su naturaleza conceptual. 

La descripción y la organización tradicional de la conducta repre- 
sentada por los conceptos de “voluntad”, “cognición”, “intelecto”, etcé- 
tera, no puede aceptarse, en cuanto pretende estar estudiando un 
mundo mental, pero la conducta a la que se aplican estos términos 
forma parte naturalmente del objeto de una ciencia de la conducta. Lo 
que re requiere en esta ciencia es un conjunto alternativo de términos 
derivados de un análisis de la conducta y capaces de desempeñar la 
misma función. Aquí no hemos realizado ningún intento de traducir 
conceptos mentalistas o filosóficos en los términos del presente sistema. 
El único valor de una traducción tal sería pedagógico. Los conceptos 
tradicionales se basan en datos a otro nivel de análisis y no puede 
esperarse que resulten útiles. No tienen cabida en un sistema derivado, 
paso a paso, de la misma conducta. 


El lector habrá advertido que casi no hacemos ni sugerimos ninguna 
extensión a la conducta humana. Esto no significa que esperemos que 
se interese directamente por la conducta de la rata. La importancia de 
una ciencia de la conducta deriva en gran medida de la posibilidad 
de su aplicación final a los asuntos humanos. Pero constituye un serio 
error, aunque común, permitir que cuestiones de última aplicación 
influyan en el desarrollo de una ciencia sistemática en sus primeros es- 
tadios. Creo que es cierto que la dirección de la presente investigación 
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ha sido determinada solamente por las exigencias del sistema. Por 
supuesto, habría sido posible sugerir aplicaciones a la conducta huma- 
na, de una forma limitada, a cada paso. Esto hubiera contribuido po- 
siblemente a una lectura más amena, pero hubiera prolongado sin razón 
alguna la extensión del libro. Además, el lector atento puede ser tan 
capaz como el propio autor de encontrar aplicaciones. El libro no 
representa más que un análisis experimental de una muestra representa- 
tiva de conducta. Cualquiera está en el derecho de hacer extrapola- 
ciones. 

Si las extrapolaciones están justificadas no puede decidirse en el 
momento presente. Es posible que haya propiedades de la conducta 
humana que requieran un tipo diferente de tratamiento. Pero esto sólo 
puede averiguarse circunscribiendo el problema de una forma ordenada 
y siguiendo los procedimientos usuales de la ciencia experimental. No 
podemos afirmar ni negar la discontinuidad entre los campos humano y 
subhumano en tanto nuestros conocimientos sobre ambos sean tan es- 
casos. No obstante, si el autor de un libro de este tipo está autorizado 
a aventurar públicamente una conjetura, puedo decir que las únicas 
diferencias que espero que se revelen entre la conducta de la rata y la 
del hombre (aparte de las enormes diferencias de complejidad) radican 
en el campo de la conducta verbal. 


La objeción que se ha hecho al tipo de sistema y método que he 
descrito aquí es que no es estadístico. Pueden darse a este término mu- 
chos significados, y al considerar las formas resultantes de la objeción, 
podemos señalar una o dos características más del conjunto de la obra. 

En el sentido simple de implicar grandes números de mediciones una 
parte muy escasa de la obra precedente es estadística. El psicólogo que 
está acostumbrado a tratar con cincuenta, centenares o millares de or- 
ganismos puede quedar sorprendido ante los grupos limitados de cua- 
tro u ocho ratas. En su caso, precisa de un gran número de casos para 
obtener curvas suaves y reproducibles. Sin embargo, el recurso a la 
estadística no es un privilegio, es una necesidad que surge de la natu- 
raleza de muchos datos. Cuando se puede obtener un grado razonable 
de suavidad y de reproductibilidad con unos pocos casos o con casos 
únicos, hay pocas razones, como no sea por hábito o afectación, para 
considerar grandes números. Siempre hay limitaciones de tiempo y 
energía que considerar, e inevitablemente hay que llegar a un compro- 
miso entre la profundidad y la amplitud de una investigación. Antes 
de pasar a nuevos problemas, he tratado de asegurar un grado razona- 
ble de reproductibilidad o de fiabilidad, pero la investigación no se ha 
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llevado más allá de este punto. Los registros presentados aquí deben 
hablar por sí solos en lo que concierne al orden que traducen. 


El sistema de conducta propuesto en el capítulo 1 es estadístico en 
otro sentido. Al estudiar la conducta de lo que Boring ha llamado el 
“organismo vacío”, se pasa por alto la cadena causal de acontecimientos 
entre estímulo y respuesta en favor de la correlación de los términos 
finales. La sustitución de la causa por la correlación a veces se llama 
estadística, pero la distinción es trivial a la vista de las modernas teorías 
de la causalidad en las que se destaca el aspecto correlacional. 


El tercer significado del término estadístico es más importante. En 
el momento actual existen dos modos completamente diferentes de abor- 
dar la conduca de los organismos que son difíciles de distinguir teóri- 
camente, pero que en la práctica son diferentes. El enfoque estadístico 
se caracteriza por métodos de medición relativamente toscos y por un 
descuido general del problema de la descripción directa. El enfoque 
no-estadístico se limita a casos específicos de la conducta y al desarrollo 
de métodos de medición y análisis directos. El enfoque estadístico 
compensa su falta de rigor en la etapa de la medición recurriendo a un 
análisis estadístico, que el enfoque no-estadístico generalmente evita. 
Las formulaciones de la conducta resultantes son tan diversas como 
los métodos a través de los que a ellas se llega. Los conceptos estable- 
cidos en el primer caso pasan a formar parte del conocimiento científico 
sólo en virtud de procedimientos estadísticos, y su referencia a la con- 
ducta de un individuo es indirecta. En el segundo caso existe una 
relación más simple entre un concepto y su referente, y una repercu- 
sión más inmediata sobre el individuo. Puede suceder que las diferen- 
cias entre los dos enfoques sean transitorias y que al fin una combina- 
ción de ambas nos depare los mejores métodos, pero en la actualidad 
se caracterizan por concepciones diferentes y casi incompatibles de la 
ciencia de la conducta. 


Es evidente que el tipo de ciencia aquí propuesto naturalmente per- 
tenece al tipo no-estadístico que acabamos de identificar. Al situarse 
en esta posición obtiene la ventaja de una especie de predicción sobre 
el individuo, que necesariamente se encuentra ausente en una ciencia 
estadística. El médico que trata de determinar si su paciente va a morir 
antes de la madrugada puede hacer poco uso de las estadísticas del 
registro civil, de la misma forma que tampoco el estudioso de la conduc- 
ta puede predecir lo que hará un solo organismo si sus leyes se aplican 
sólo a los grupos. La predicción individual es de capital importancia, en 
tanto el organismo se trate científicamente en cuanto un sistema some- 
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tido a leyes. Hasta que podamos prescindir de la necesidad de elegir 
entre los dos enfoques, debemos probar suerte con una investigación 
no-estadística del individuo y lograr el grado de fiabilidad o de repro- 


ductibilidad que podamos, mediante el desarrollo de técnicas de me- 
dición y de control, 
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Asfixia, su efecto sobre la fuerza del re- 
flejo, 430. 

Ausencia de un estímulo como propiedad 
discriminativa, 240. 

Aversión, 387. 


B 


Bebida (razón de), 372 y sig. 

Bencedrina 

su efecto sobre la extinción, 427 

efectos sobre el recondicionado perió- 
dico, 429 

relación con el impulso, 427 


C 


Cadena de reflejos, 47. 

análisis de cadena, 68 

extinción de la cadena, 118 y sig. 
Cafeína 

efectos sobre la extinción, 427 
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efectos sobre el rec, per., 424, y sig. 
Caja experimental, 65 y sig., 71. 
Cambios compensatorios en la tasa de in- 
gestión, 360 y sig. 
Capacidad para la discriminación, 245. 
Catalogación de reflejos, 24, 62. 
Ciclos del hambre, 356. 
Ciencia de la conducta (Cap. uno), 7. 
independencia de, 440. 
Cognición, 456. 
Compatibilidad de los reflejos, 44. 
Condicionamiento (Cap. tres), 78 y sig. 
definición, 78 
impulso y (Cap. diez), 393 y sig. 
estados intermedios de, 132 y sig. 
medida de, 80 
negativo, véase cond. negat. 
condicionamiento secundario, tipo R, 
259 y sig.; tipo S, 98 y sig., 259 y 
sig.; tipo R, 36 y sig., 83 y sig.; y la 
reserva, 102; retardado, 89, 164 y 
sig.; razón de extinción y, 154 y si- 
guientes; ley de, 36; de respuestas 
autónomas, 128 y sig.; tasa de, 83 
y sig. 
tipo S, 61, 79 y sig., 131; su amplia- 
ción a las respuestas esqueléticas, 
131; su ampliación a la conducta 
operante, 273 y sig.; ley de, 33; 
tasa de, 81; tipos combinados, 2783 
y sig., 275 y sig.; tipos comparados, 
87, 125. 
Condicionamiento negativo (del tipo R), 
83, 124, 
su efecto sobre la reserva, 168 y sig. 
al determinar la forma de la respuesta, 
323 
periódico, 166. 
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Condicionamiento secundario, 

tipo R, 260 y sig. 

tipo S, 96, 259 y sig. 

Conducta 

definición, 20 

medición, 74 y sig. 

ciencia de la, 17 

independencia de, 440 

sistema de (Cap. uno), 17 y sig. 

definición de sistema, 449. 

Conducta adaptativa, 455. 

Conducta humana, aplicabilidad a, 456- 
457. 

Conducta ingestiva, 357 y sig. 

Conducta operante, 34 y sig., 55. 

extensión del condicionamiento tipo S 
a la —, 273 

en relación a la conducta respondiente, 
454 

cambio de énfasis hacia, 458. 

Conductividad, sinapsis, 434. 

Contraste, 191. 

Control voluntario de respuestas autonó- 
micas, 128. 

Correlación entre respuesta y reforza- 
miento 

falta de, 179 y sig. 

negativa, 176 y sig. 

Correlación negativa de la respuesta y 
el reforzamiento, 176 y sig. 

Correlatos neurológicos, 437 y sig. 

Correlatos neurológicos cad la conducta, 
437 y sig. 

Cualidad, 183. 

Curvas compuestas, 148. 

Curva de aprendizaje en la discrimina- 
ción, 246. 

Curvas de calibración para 'la intensidad 
de la respuesta, 325. 


D 


Definición de las propiedades de S y 
de R, 50 y sig. 

Deseo y aversión, 387.: 

Desviaciones a partir de una tasa cons- 
.tante bajo reforzamiento periódico, 
138 y sig. 

Desviaciones cíclicas en la extinción, 92 
y sig. 

Diferenciación de una respuesta (Capí- 
tulo ocho), 322 y sig. 

combinada con discriminación, 352 y 
siguientes 
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comparada con la discriminación, 322 
352. 

Dirección de la investigación, 60 y sig. 

Discriminación de un estímulo (Cap, cin- 
co), 183 y sig. 

capacidad de, 245 

combinada con diferenciación, 352 
y sig, 

comparada con la diferenciación, 322 
y sig., 352. 

latencia de la respuesta en, 225, 229, 
254 y sig. 

temporal, véase discriminación tem- 
poral 

tipo S, 189 y sig.; abolición de, 192; 
inestavilidad, 192; ley de, 186 

tipo R, 193 y sig., 268; abolición de, 
208 y sig.; después de recondiciona- 
miento periódico, 198 y sig.; ley de, 
243; medidas de, 207 y sig.; recon: 
dicionamiento después de, 208 y sig.; 
en relación a la reserva, 214 y sig.; 
remota, 195; inversión de, 226 y sig.; 
sin condicionamiento previo, 219 y 
siguientes; sin recondicionamiento 
periódico previo, 217 y sig. 

Discriminación remota, 195, 

Discriminación temporal (Capítulo siete), 
278. 

durante recondicionamiento periódico, 
285. 

Desinhibición, 113 y sig. 

Drogas, su efecto sobre la fuerza del 
reflejo, 62, 4293 y sig. 

Duración de una respuesta diferenciada, 
324 y sig., 342 y sig. 


E 


Edad, su efecto sobre la fuerza del re- 
flejo, 62. 

Efecto depresivo de los estímulos en la 
discriminación, 268 y sig. 

Ejercicio, ley de, 30. 

Emoción, 420 y sig. 

definición de, 421 

operación que afecta a la fuerza del re- 
flejo, 38, 62-63. 

Empatía, 59. 

Empirismo británico, 278. 

Enfermedad, su efecto sobre la fuerza 
del reflejo, 430. 

Enfoque clínico de la conducta, 438 y 
siguientes. 


Enfoque neurológico de la conducta, 
432 y sig., 455. 
Epistemología, 59. 
Espontaneidad, 34 
actividad espontánea, 376 y sig. 
Estadística, 457 y sig. 
“Estado”, como el hambre, etc., 39. 
Estímulo 
condicionado, funciones de, 259 y sig. 
definición, 23, 48 
discriminativo, 251 y sig. 
el impulso no es un —, 389 y sig. 
provocador, 249 y sig. 
emocional, 257 y sig. 
funciones de (Capítulo seis), 247 y sig. 
naturaleza genórica de, 48 y sig. 
clases de, 249 y sig. 
reforzante, 256. 
Estímulo discriminativo, 251 y sig. 
como “inhibidor”, 247 
como estímulo reforzante, 261 y sig. 
condicionado, 273 y sig. 
Estímulo provocador, 249 y sig. 
Estímulo reforzante, 256. 
condicionado, 259 y sig. 
discriminativo, 261 y sig. 
Estímulos condicionados, efectos de, 259. 
Estímulos condicionados, funciones de, 
259. 
Estímulos emocionales, 257 y sig. 
condicionado, 259. 
Excitabilidad sináptica, 334. 
Explicación mentalista de la conducta, 17. 
Explicación neurológica de la conducta, 
432 y sig. 
Explicación psíquica de la conducta, 17. 
Extinción (Cap. tres), 78 y sig. 
como inhibición, 112 y sig. 
como medida del condicionamiento, 102 
y sig. 
tipo R, 36 y sig.; después de la dife- 
renciación de la respuesta, 336 y sig, 
349 y sig.; después de 45 días, 108- 
109; después de reforzamiento nega- 
tivo, 173-174; después del recondi- 
cionamiento periódico, 149 y sig., 
289; después de reforzamiento de 
razón fija, 308 y sig.: efecto bence- 
drina, 428; efecto cafeína, 424; efec- 
to del reforzamiento negativo sobre, 
166 y sig.; inducción en, 195 y sig.; 
ley de, 36; de reflejos encadenados, 
118 y sig.; de reflejos reforzados en 
la discriminación, 214 y sig.; tasa 


de, 90 y sig.; en relación al impulso, 
394 y sig.; recuperación espontánea, 
"95; después de razón fija, 293 y sig; 
tipo S; más allá de cero, 126; dife- 
nición de, 81 y sig.; ley de, 33; 
tasa de, 81 y sig. . 


F 


Facilitación, ley de, 31. 

comparada con la inhibición, 31 

comparada con la sumación, 47. 

Fase refractaria 

y reserva, 42 

ley de, 30 

sináptica, 434. 

Fatiga, reflejo de, 31. 

Fatiga general, su efecto sobre la fuer- 
za del reflejo, 423 y sig. 

Fijación, 323. 

Fisiología refleja, 435-436. 

Fuerza del reflejo 

definición, 29 

leyes de, 24 y sig., 62 

en relación a la reserva, 42, 

Funciones de los estímulos (Cap. seis), 
247 y sig. 


G 


Gatos, conductas ingestivas, 365, 
Generalización e inducción, 185. 
Gradiente, 304 y sig. 

Gráficos, significado de, 76. 


H 


Hambre, véase impulso 

y apetito, 382 

y actividad espontánea, 380 

naturaleza de, 356. 

subhambres, 383. 

Hipótesis, 60, 452 

Hormonas, su efecto sobre la fuerza del 
reflejo, 423 y sig. 


I 


Identificación, 59. 

Impulso (Cap. nueve), 355 y sig. 

y condicionamiento (Cap. diez), 393 y 
siguientes 

como inhibición, 391 y sig. 

clasificación, 385 y sig. 
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comparación de impulsos, 416 y sig. 

control de, 71 y sig., 108, 204 

efecto de la bencedrina con bajo, 428 
y sig. 

efecto de la cafeína sobre, 424 y sig. 

efecto de — sobre la curva de extin- 
ción, 395 y sig. 

máximo, 401, 409 y sig. 

múltiples, 386 y sig. 

naturaleza de, 382 

no es un estímulo, 389 y sig. 

en relación con la fuerza del reflejo, 
37 y sig. 

relación de el — con la reserva, 390 
y sig. 

sed como un — arbitrario, 374 y sig. 

transferencia del hambre a la sed, 376. 

Inanición, estado de hambre durante —, 
409 y sig. 

Inducción, 

diferentes usos del término, 190 

en la discriminación, 183 y sig., 218 
y sig., 233, 242 y sig., 244; en un 
estadio tardío, 222 y sig. 

ley de, 47 

y unidad de conducta, 52. 

mostrada en la extinción, 197. 

Inhibición 

y estímulos discriminativos, 247. 

como impulso, 391. 

como extinción, 112 y sig. 

ley de, 31. 

como reforzamiento negativo, 173. 

de retraso, 283, 

reflejo, 436 y sig. 

Inhibición condicionada, 247 y sig. 

Inhibición diferencial, 247 

Insulina, su efecto sobre la fuerza del 
reflejo, 430. 

Intelecto, 456, 

Intensidad de la respuesta diferenciada, 
324-325. 

Intensidad de los estímulos, 187. 

Intervalo entre respuesta y reforzamiento, 
89 y sig. 

durante recondicionamiento periódico, 
155. 

durante la extinción, 122 y sig. 


L 


Latencia, 

ley de, 27 

de una respuesta discriminativa, 225, 
229, 254 y sig. 
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sináptica, 434. 
Leyes dinámicas de la fuerza del reflejo, 
29 y sig. 
Leyes estáticas del reflejo, 26 y sig. 
Libre albedrío, 17. 


M 


Magnitud de la respuesta, ley de, 27 
y sig. 

Materialismo, 455. 

Medida de la conducta, 74 y sig. 

Método, 

experimental (Capítulo dos), 60 y sig. 

científico, 60. 

Método científico, 60. 

Método de obstrucción “de Columbia”, 
416. 

Mezcla de reflejos, 46. 


N 


Narración como descripción, 22. 

Naturaleza genética de S y de R, 48 
y sig. 

Neuronas, 432. 


O 


Olvido, 
comparado con la extinción, 107 y sig. 
pérdida de la discriminación, 338. 


P 


Pérdida de la diferenciación de la res- 
Puesta, 333 y sig. 

Posición de los estímulos, 187. 

Positivismo, 60. 

Postulados, 451. 

Post descarga, 27. 

sináptica, 434. 

Prepotencia, ley de, 45. 

Presión sobre la palanca, 

diferenciada, 324 y sig. 

normal, 326. 

Propiedades de los estímulos, 185 y sig. 
Provocación como operación que afecta 
la fuerza del reflejo, 28 y sig. 
Pseudo reflejo, 251 y sig., 2783. 

Psicología, 19, 


R 


Rata, animal experimental, 63, 64. 
Razón, ver: razón de extinción y razón 
fija. 
Razón de conducta, 453. 
Razón de extinción, 142. 
comparada con razón fija, 308 y sig. 
efecto del impulso sobre, 405 y sig. 
en el estudio del condicionamiento, 154. 
Razón fija, reforzamiento a, 292 y sig. 
Recondicionamiento, 
después de discriminación, 208 
después de extinción, 95 y sig 
periódico, ver “Recondicionamiento pe- 
riódico”. 
Recondicionamiento periódico (Capítulo 
cuatro), 132 
después de la discriminación, 227 
después de razón fija, 319 y sig. 
con diferentes impulsos, 405 y sig. 
retardado, 155 
efectos de la bencedrina sobre, 429 
efectos de la cafeína sobre, 424 y sig. 
extinción después de —, 149 y sig. 
negativo, 166 y sig. 
de una respondiente, 181 
en la discriminación temporal, 285 
con agua, 374. 
Recuperación espontánea, 
después de la extinción, 95 y sig; 101 
después de 45 días, 109-110. 
Recuperación espontánea de la extinción, 
95, 100 
después de 45 días, 109, 110, 
Reflejo, 
definición, 23 
retardado, 281 y sig. 
pseudo, 251 y sig. 
de huella, 281. 
Reflejo retardado, 281 y sig. 
Reflejos condicionados, cambio en la 
fuerza a causa del impulso, 367. 
Reflejo de flexión, 50, 
Reforzamiento, 
de razón fija, 292 y sig. 
definición, 79 
retardado, 89 y sig. 
periódico, ver Recondicionamiento pe- 
riódico. 
Reforzamiento retardado, 89 y sig., 155 
y sig. 
Relación temporal de los estímulos en el 
condicionamiento, 81. 
Reproductibilidad, 57. 


Reserva del reflejo, 41. 
condicionamiento y —, 100 y sig. 
impulso en relación a, 390-891; 414 
y sig. 

efecto del reforzamiento negativo sobre 
la —, 170-171 

en las discriminaciones, 214, 243 y sig. 

ley de reserva operante, 244 

pérdida de la —, con el tiempo, 107 
y sig. 

tamaño máximo de —, 106 

en relación a la fuerza, 42 

recuperación espontánea y, 100 y sig. 

Reserva operante, ley de, 244 y sig. 

Respuestas autónomas condicionadas se- 
gún el tipo R, 128. 


S 


Salud, su efecto sobre la fuerza del re- 
flejo, 62, 423 y sig. 
Sed, 372 y sig. 
como impulso arbitrario, 374 
control de, 372. 
Sexo, su efecto sobre la fuerza del re- 
flejo, 62. 
Símbolos, 67 y sig. 
Sinapsis, 432, 434. 
Sistema de conducta (Capítulo uno), 17. 
definición de sistema, 449 y sig. 
Sistema nervioso, 
como explicación ficticia de la conduc- 
ta, 18 
y conducta (Capítulo doce), 432 y sig. 
Sistema nervioso central, 435. 
Sistema nervioso conceptual, 435. 
Sueño, cambio en la fuerza del reflejo, 
431. 
Sumación, 
algebraica, 45 
espacial, 46. 
temporal, 28. 
Supresión de una discriminación, 
tipo R, 208 y sig. 
tipo S, 192 
tipos comparados, 212. 


T 


Tasa de ingestión, 356, 357. 

Tasa de respuestas, 

como medida de la fuerza de una ope- 
rante, 74 
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constancia bajo recondicionamiento pe- 
riódico, 134 y sig. 
Teoremas, 451. 
Terminología popular, 20, 21, 22, 58 y 
siguientes. 
Términos, 20, 21, 58 y sig. 
Tiempo, ver intervalo 
como un continuo discriminable, 278 y 
siguientes 
como propiedad de un estímulo, 284 y 
siguientes. 
Tipos de reflejos condicionados, ver con- 
dicionamiento. 
Topografía de la conducta, 25-26. 
de los estímulos, 186-187. 
Tropismo, 450. 
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U 


Umbral, 26-27. 
de un pseudo reflejo, 254. 
Unidad de conducta, 48 y sig; 315-316. 


vV 
Valencia, 450-451. 
Variabilidad en la conducta, base del 
concepto de impulso, 355 y sig. 
Variables, - 
combinación de, 393 y sig. 
selección de, 450. 


Vector, 450. 
Volición, 456. 
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REGISTRO ACUMULATIVO 
B. E. Skinner 


Burrhus Frederick Skinner nace 
en Susquehanna (Pensilvania) 
en 1904. En 1931 recibe el doc- 
torado en Psicología en Harvard, 
donde trabaja hasta 1936 en in- 
vestigaciones psicofisiológicas. 
De 1936 a 1945 enseña Psico- 
logía experimental —desde una 
óptica tradicional— en la Uni- 
versidad de Minnesota. En 1945 
se traslada a la Universidad 
de Indiana como director del 
departamento de Psicología, per- 
maneciendo en ella tres años. 
A partir de 1948 es profesor de 
Psicología en Harvard donde to- 
davía permanece en la actuali- 
dad. En 1958, la American Psy- 
chological Association le otorga 
el Premio a la Contribución Cien- 
tífica Distinguida; en 1968, el 
presidente de los Estados Uni- 
dos le concede el Premio Nacio- 
nal de la Ciencia; en 1971 recibe 
el Premio Kennedy para Investi- 
gación en el Retraso Mental, y 
este mismo año obtiene también 
la medalla de oro que la Ameri- 
can Psychological Foundation 
concede a un psicólogo impor- 
tante por una vida de realizacio- 
nes científicas. En la citación se 
lee lo siguiente:. Skinner es «un 
pionero en la investigación psi- 
cológica, un líder en la teoría, 
un maestro en la técnica, que 
ha revolucionado el estudio del 
comnartamiento en nuestro tiem- 
po. Un «isntífico de primera 
=> lud, investigador, maestro 
y escritor, r2cibe este homenaje 
r-. ios muchos servicios que ha 


prestado a todos los psicólo- 


gos». junto a Pavlov, Skinner es, 
probablemente, el autor más im- 
rortar.e entre cuantos han con- 
tribado al desarrollo de una 
genuina ciencia de la conducta. 


